Ebben a bejegyzésben feltérképezzük a székelyföldi (Hargita, Kovászna és Maros megyei) városokból elszármazottakat, Erdély-, Románia-, Európa- és világszerte – és egy interaktív adatvizualizáción keresztül bemutatjuk a Székelyföldi Diaszpórát: Facebook-bányászattal adatokat gyűjtünk, geolokalizált tortadiagramokkal elemzünk és egy érdekes eloszlási törvényre is rávilágítunk! Kiderül, hol lakik a 100.000 emigráns/ideiglenesen külföldön elő/dolgozó/tanuló székelyföldi.

This post is about mapping the diaspora of the Székely people as they spread out across the countries of the world. Using Facebook-mining of location and birth-place data, we construct a comprehensive picture and investigate the statistics using geolocated piecharts and Sankey diagrams. In the end, we highlight the existence of the rank-size distribution among the target settlements of the Székely emigrants and scale the findings of the sample to the full population.

Számtalanszor hallottuk már, hogy a világ exponenciálisan növekedik – vagy éppen zsugorodik: Nagyapáink számára a 10 kilométerre található szomszédos falu már majdnem külföldnek számított. Ez a volt a maximum távolság, ha “elköltöztek”. Szüleink az iparosodás hullámával megtízszerezték ezt a távolságot és a 100 km-re található nagyobb város lett a cél, bár a rendszerváltáskor sokan bevállalták az 1000 kilométeres utat és átköltöztek Magyarországra – immár “igazán” külföldre. A mi generációnk nem egyszer ennek többszörösét tesszük meg, amikor hazautazunk – néha akár 10 000 kilométert is, más földrészről hazatérve, óceánon át. De hányan?

Hivatalosan ehhez az információigényhez meglennének az állami statisztikák, akár több évre visszamenőleg is. Köztudott azonban, hogy az uniós határok megnyílása óta ezek a statisztikák merőben félrevezethetnek, hisz nem mindenki jelenti önként be, hogy most éppen külföldön dolgozik/tanul/lakik, sőt… Ezért egy sokkal innovatívabb – furfangosabb 🙂 – módszer alkalmzasához folyamodtunk: a közösségi-média-bányászathoz (social media mining). Facebook-on be lehet jelölni a születési-, illetve jelenlegi lakhelyet. A Facebook felemelkedésének korában ez publikus információ volt és bár azóta lehetséges a letiltása, sok felhasználó esetében ez a mai napig elérhető. A Graph Search-ön egy egyszerű keresést lefuttatva megjeleníthető, hogy egy adott városban (például Csíkszereda) születettek hol laknak jelenleg (persze a kisebb településeknek általában több – akár 10 – nevük is van, de a Facebook a városokat automatikusan egy egységes azonosítóval látja el). A Graph Search keresőoldala korlátozza ugyan a megjelenített találatokat, de egy ügyes böngésző-automatizálással akár több ezer találatot is betölthetünk (gyakorlatilag amíg megtelik a számítógépünk memóriája).

Ezt a kereső algoritmust lelfuttatuk 16 erdélyi városra, Hargita, Kovászna és Maros megye legnagyobb településeire (* Parajd nem város hivatalosan, de méreteiben annak tekinthető). Némelyek esetében az összes (publikus születési helyinformációval rendelkező) Facebook-felhasználót megtaláltuk az adott városból (kimerítő keresés – exhaustive search). A statisztikai függetlenség érdekében, két egymástól teljesen független keresési epizódot tartottunk, sőt, az egyiket egy frissen regisztrált, 0-barátos felhasználóval, valamint a másikat egy saját, néhány éves, Székelyföldet többé-kevésbé behálózó kapcsolatokkal rendelkező felhasználóval. Azonban nem minden felhasználó, akinek publikus a születési helye, osztja meg a lakhelyét is, valamint néhány esetben az adatok használhatatlanok, így az egész keresésnek egy minőségi szűrésen kellett először átmennie. Figyelembe véve a vizsgált városok népességét, valamint a lakosság Facebook-felhasználó arányát (illetve adatmegosztásra való hajlamosságát), meglepően sok adatot sikerült összegyűjtenünk – összesen 61789 felhasználóprofilt. Az elemzés megkönnyítése érdekében a találat/profil/kivándorló/elszármazott/külföldön letelepedett kifejezést a találatok kontextusában fogjuk használni – megjegyezve, hogy ez természetesen sok esetben csak ideiglenes ott-tartózkodást jelent. A városok azonosítására az elemzés során egy állandó színkódot fogunk használni, mely az alábbi táblázatban szerepel, a bányászott adatokkal együtt (népességi adatok a 2011-es romániai népszámlálás alapján): Csíkszereda: 2320 profil, ebből használható: 1857, ez a lakosság ( 37980 ) 4.89 %-a – a felső sor mindig a régebbi profillal van bejelentkezve.

Város Profil OK Lakos % Csíkszereda 2320 1857 37980 4.89 (második epizód) 1715 1368 37980 3.6 Székelyudvarhely 2180 1793 34257 5.23 II. 1638 1307 34257 3.82 Sepsiszentgyörgy 2314 1888 54312 3.48 II. 1645 1321 54312 2.43 Marosvásárhely 2236 1739 134290 1.29 II. 2191 1803 134290 1.34 Barót 2194 1908 8567 22.27 II. 2051 1768 8567 20.64 Gyergyószentmiklós 2264 1837 18377 10.0 II. 1883 1495 18377 8.14 Kézdivásárhely 2188 1805 18491 9.76 II. 2031 1658 18491 8.97 Székelykeresztúr 2300 2013 9491 21.21 II. 1961 1598 9491 16.84 Kovászna 2244 1786 10265 17.4 II. 2002 1616 10265 15.74 Balánbánya 2216 1842 5864 31.41 II. 1967 1635 5864 27.88 Szentegyháza 590 519 6820 7.61 II. 1834 1585 6820 23.24 Parajd 1116 1000 6502 15.38 II. 1124 995 6502 15.3 Szováta 1491 1301 10234 12.71 II. 1495 1317 10234 12.87 Szászrégen 2242 1874 33281 5.63 II. 1988 1668 33281 5.01 Segesvár 1765 1439 28102 5.12 II. 2128 1748 28102 6.22 Maroshévíz 2250 1893 13285 14.25 II. 2226 1863 13285 14.02

A nagy városok esetében a lakosok 3-5%-a felelt meg a keresési kritériumoknak (kivéve Marosvásárhely, itt az arány 1.3% a nagy népesség miatt), míg a kisebbeknél ez majdnem az egyharmadot is elérte. A 10 000-nél kevesebb lakosú városokban a keresés teljesen kimerítő volt – azaz nem maradt feltérképezetlen felhasználó. Ezzel azonnal hozzájutunk ahhoz az információhoz, hogy (* ha a városok közötti trendek nem merőben elétérőek) a székelyföldi városi lakosság egynegyedének-egyötödének van publikus helységmegjelöléssel ellátott Facebook-profilja (Balánbánya kivételével, ahol ez az arány valamivel nagyobb – majd még erre később visszatérünk). Ha egy konzervatív becsléssel az összes Facebook felhasználót ennek a duplájára, azaz a teljes városi lakosság felére (215059) tesszük, akkor bármelyik felhasználó elérhető két közbeeső barát segítségével (3 lépés távolság – minden felhasználónak 60, páronként nem közös barátot feltételezve, ezen a blogon már volt erről szó).

Az így bányászott helységadatokat geokódóltuk, majd a világtérképre vetítettük, városok szerinti színkodolással – megkapva ezáltal a székelyföldi városok egységes (Facebook-alapú) emigránstérképét. A célvárosokat méretarányos pöttyökkel jelöltük, valamint, ha egy célváros több székelyföldi forrásvárossal bír, akkor méretarányos tortadiagramokká alakítottuk a pöttyöket (a pöttyök méretének skálája nem lineáris és 50 főnél maximalizálódik!).

Székelyföldi diaszpóra

Hargita,Kovászna és Maros megye városaiból elszármazottak szerte a világban

(interaktív – teljes képernyő, statikus)

A fenti adatvizualizáció nagyon sok böngésznivalót rejt magában:

A bal oszlopban található menüpontokban egy bizonyos régióra közelíthetünk rá.

Ki/be kapcsolhatjuk a vándorlási vonalakat (ez jelentősen leterheli a grafikus processzort).

Az egeret az egyes székelyföldi, menüben felsorolt városok fölé mozgatva szűrhejtük a megjelenített pontokat, valamint kattintva el is tűntethetjük ezeket – lehetőséget nyújtva pl. csak egy bizonyos város diaszpóráját vizsgálni.

Az egyes célvárosok és célországok fölött időzve információkat kapunk az odavándoroltakról.

Országokra kattintva ráközelíthetünk egyes országok városaira, valamint a vándorlási vonalak is automatikusan követik a választásunk.

Görgővel, valamint dupla kattintással nagyíthatunk/kicsinyíthetünk a térképen.

Bármely óceánra való kattintással visszatérünk a kezdeti világnézetbe.

Ne felejtsük, hogy az itt megjelenített számok maguk a valós, bányászott számok!

A globális képet vizsgálva láthatjuk, hogy a világ csaknem minden pontjára eljutottak a székelyföldiek, Grönlandtól Tahitiig, Madagaszkártól Szibériáig. Első látásra nincs különösebb meglepetés, és a bejegyzés elején bemutatott exponenciális történet is helyt áll: Az észek-amerikai kontinensen és az Öreg Hölgyön kívül nagyon szétszórt a diaszpóra, Európát mindjárt külön vizsgáljuk. Ázsiában (Közel-Kelet nélkül) ~50, Dél-Amerikában kb. 30, Ausztráliában és Afrikában 10-10 találat volt. A Közel-Keleten összesen ~100 honfitárs él, ebből 30-30 Cipruson és Izraelben, valamint 16, illetve 17 Irakban és az Egyesült Arab Emírségekben.

Amerikában és Kanadában 233, illetve 65 találat született, javarészt a hagyományos magyarországi letelepedési vonalak mentén: New York, Toronto, Chicago és Los Angeles rendelkeznek 10-nél több hosszab-rövidebb ideig ott tartózkodó székelyföldivel. A többi nagyváros, Miami, Atlanta, Montreal és Calgary következnek a sorban. A 16 székelyföldi város mindenike majdnem a lakosságával arányosan van jelen az amerikai kontinensen.

Természetesen Európa a legfőb emigrációs célpont, ám a célországok a székelyföldi régiók sajátosságainak megfelelően váltakoznak. Romániára 23421 találat érkezett, de ez magában foglalja a születési településükön élőket is. Magyarországon 2723, Németországban 1109, az Egyesült Királyságban 743, Olaszországban 612, Ausztriában 210 elszármazottat pipálhatunk ki.

Valószínüleg kulturális és kapcsolati-ismerősi hálójuk sajátosságaira alapozva, a maroshévíziek és balánbányaiak messze leggyakoribb célpontja Olaszország – e két település adja az olaszországi találatok kétharmadát! De Magyarország és Németország és az Egyesült Királyság is fő célpont. A balánbányán születettek diaszpórája óriási és a vizsgált városok közül messze ez foglalja magában a legtöbb egyéni céltelepülést.

A csíki-, gyergyói- és udvarhelyszékiek messze leginkább az anyaországi vonalon mozognak, ezt követi Németország és az Egyesült Királyság angliai része. A gyergyóiak, a két fenti városhoz hasonlóan, a déli településekhez képest nagyobb arányban merészkednek távolabbra.

A háromszékiek is hasonló vándorlási vonalat követnek, részben a területeken átívelő kapcsolati hálóknak köszönhetően, bár Németországban jóval többen és Angliában is túlsúlyban vannak az északi székekbeliekhez képest. Ám Németországban a marosmegyei – szász – vidékek lakói vannak a legtöbben.

Németország mellett Olaszországban és Spanyolországban is száznál több találatra leltünk. Németországot Magyarországnál is többen választják Marosszékről célpontul, főként a segesváriak és a szászrégeniek.

Érdemes megfigyelni, hogy mennyire urbán-szelektív emigrációról beszélhetünk: míg egyes országokba a kivándorlás egyenletesen eloszlik a kisebb-nagyobb városok között – erre tökéletes példa Magyarország, területe teljesen le van fedve pöttyökkel (bár itt is Budapesten lakik az emigránsok egyharmada!) – máshol rendkívül központosított és a fővárosra és környékére redukálódik – Írország, Anglia, Franciaország, Ausztria. A Németországéhoz hasonló gazdasági helyzettel, területtel rendelkező Franciaországban csak tizedannyian találtak végleges vagy ideiglenes otthonra (ebben kétségkívül térségünk történelme, de például az idegennyelv-oktatás is közrejátszik) és a néhai NSZK és NDK határát a mai napig akár szabad kézzel, fehér krétával rajzolhatnánk a térképre – mi több, a Német Köztársaságon belül is főként Bajorország a székelyföldiek célpontja – valószínüleg kulturális, illetve gazdasági szálakon. A volt szovjet blokk államaiba még Afrikánál is kevesebben költöznek, ám a Kanári-szigetekre annál többen.

Az országon belüli mozgás legalább annyira népes, mint az emigráció. A székelyföldiek természetesen a nagyvárosokba tartanak – tanulni, dolgozni, szerencsét próbálni – de itt is megfigyelhetőek regionális különbségek. Bukarestben kevesebb, mint feleannyian vannak, mint Budapesten (438 vs. 1078) és ebből pl. csíki csak 25, udvarhelyi 5. Talán kevesebb egyetemista marad az egyetemista városokban, mint előre sejtenénk – de Kolozsvárnak továbbra is hatalmas a szívóereje: tizenhétszerakkora, mint Temesvárnak vagy Nagyváradnak! A székelyföldi városok mindenikéből 100-200-an próbálnak szerencsét jelenleg Kolozsváron a Facebook szerint. A következő a rangsorban Marosvásárhely, feleakkora sármmal, mint Kolozsvár, majd következik Csíkszereda és Brassó. A balánbányai diaszpóra látványosan terül el az egész ország területén, egy évszázados iparág hanyatlásának hagyatékaként. A segesvári diaszpóra, bár méretében kisebb, hasonlóan terebélyes.

Székelyföldre közelítve láthatjuk, hogy azért nem olyan nagy a baj, a székelyföldi városok mindenikében az “otthoniak” vannak messze a legtöbben. A Gyergyószékiek sokkal inkább az Olt völgye felé költöznek, mint a Maros irányába, akárcsak a csíkiak, bár ez utóbbiak az erdélyi nagyvárosokat is előszeretettel veszik célba. Az udvarhelyiek a medencéjük adottságait kihasználva, annak mind a négy kijáratának irányába előszeretettel költöznek falvakba, akárcsak a háromszékiek, míg a csíkiak kénytlenek az Olt-sávban maradni. Marosszék a régió többi részével és a többi erdélyi nagyvárossal is erős migrációs kapcsolatban áll (*a kis székelyföldi települések nevei helyenként tíznél is több formában jelentek meg az adatbányászat során, nem egyszer Hargita és Kovászna megye felcserélésével – ebből kifolyólag van néhány szembeötlő geokódolási hiba, de ezek az következtetéseinket jelentős mértékben nem befolyásolják).

Székelyföldi városok migrációs arányai

(interaktív – teljes képernyő, statikus)

Ha megvizsgáljuk a 16 város migrációs arányait, láthatjuk, hogy átlagosan a találatok egynede jelölt meg külföldi települést mostani lakóhelyéül. Az országon belül más megyékbe költözöttek száma viszont nagyon régiófüggő. A balánbányán születettek majdnem fele már más megyében lakik, míg 39%-uk külföldön él – azaz csak 11% az, aki otthon maradt. Ezzel szemben a háromszékiek és udvarhelyszékiek alig költöznek más megyébe, gyakorta inkább külföldre. Az alábbi Sankey típusú folyamatábrákon országokra és megyékre lebontva mutatjuk be a nacionális és internacionális emigrációt. Ezekről a vizualizációkról jól kivehetőek az egyes városok kedvelt célországai, célmegyéi. Minden város lakosságát 100-al szimbolizáltuk, és a városokból induló folyamathúrok ennek megfelelően méretarányosak. A megyeközti mozgás esetében a születési helyükön élőket most nem vettük figyelembe, ezért csak az elköltözőket jeleníti meg a diagram.

Székelyföldi városok migrációjának százalékos folyamatábrái

(interaktív – teljes képernyő ország | megye, statikus ország | megye)

Bár a Facebook profilok szerinti diaszpóra nominális értékei önmagukban is rendkívül hasznosak, az igazi feladat lefordítani a Facebook-számokat valós népességi becslésekre. Talán a legegyszerűbb lehetőség az, hogy feltételezve, hogy a jelengi minta reprezentatív (végtére is több, mint a lakosság 5%-a a legtöbb város esetében – 2%-os vagy annál kisebb hibaküszöböt jelent) és az emberek egyenlő eséllyel választanak országot, illetve várost, véletlenszerűen elosztjuk a a lakosság maradék 95%-át a világ városaiban. Igenám, csakhogy az emberek egy közösségi hálóban élnek és az emigráció is ennek a hálózati törvényein alapul – gondoljunk csak bele: egy olyan városba, ahol már nagyon sok városbeli, potenciális barát, ismerős, rokon él, nagyobb eséllyel jut el valaki, mint egy teljesen idegen helyre, egyedül. Mi több, ez az esély jóval nagyobb.

Tegyük fel, hogy egy Sepsiszentgyörgyön született lakos külföldre költözne és elméletileg mehetne Berlinbe és Prágába. Berlinben már 30 más szentgyörgyi, volt ismerőse, barátja várja, Prágában viszont csak 10. Ha feltételezzük, hogy ennek hatására háromszor nagyobb eséllyel választja Berlint (a csíkszredai Barabási Albert László és Albert Réka által kidolgozott lineáris preferenciális csatolódási modell – preferential attachment – alapján), akkor Londonba, ahol 1000 szentgyörgyi van, százszor akkora eséllyel jut el, mint Prágába. Ezt az eredményezi, hogy egy idő után majdnem minden szentgyörgyi emigráns Londonban köt ki. Ez a legtöbb közzöségi hálózat – mint amilyen feltételezhetően az emigrációs kapcsolati háló is – sajátossága. Tehát a lakosságra csakis úgy lehetne átvetíteni a Facebook-bányászat során nyert eredményeket, hogy a már meglévő közösségek a jelenlegi méretükkel (és rangsorban elfoglalt helyüket megőrizve!) arányosan osztanánk szét a lakosságot. Ez azonban nem ennyire egyszerű, mert egy nemlineáris probléma: sajnos nem tudhatjuk, hogy a jelenlegi, körülbelül 5%-os mintánk a hálozat legösszekötötteb (hub), vagy leggyengébb (leaf) láncszemeit vonultatja fel – ehhez a Facebook graph-search algoritmusát kellene mélyen tanulmányozni, ugyanakkor lehet hogy egy nagyon befolyásos ismerős nemrég utazott ki egy kisebb városba és az ottani közösség még csak most kezd el ennek hatására növekedni.

Azonban, ahogy az elején említettük, néhány város esetében kimerítő volt a keresés – azaz a megtalálható személyek mindenikét feltérképeztük. Ha feltételezzük, hogy kellően sokan vállalták a publikus helyzetmegosztást a profiljukon (ami alapbeállításban publikus, maga a felhasználó kell deaktiválja), akkor valóban reprezentatív mintát kapunk a városról. Persze azt újra nagyon nehéz megállapítani, hogy mekkora például a kapcsolati hálóátfedettség két város vagy két régió polgárai között – és külön a forrásváros és a célváros esetében.

Van viszont egy másik törvény is, ami a városok, mint települések sajátosságaira vontakozik: a rangsor-méret szabály (Argentína, USA). A rangsor-méret szabály szerint a legnagyobb társadalmi egységek exponenciálisan nagyobbak, mint a kisebbek. Ez annyit tesz: a világon a legnagyobb (egy-két) igazán népes országhoz (India, Kína) képest, a rangsorban népességre következő 3.-4. (Amerika, Indonézia, Brazília, Pakisztán, Banglades) feleakkora, a következő 5.-6. újra feleakkora (Oroszország, Nigéria, Japán), és így tovább. Ha a rangsor-méret szabályt egy adott, fizikailag határolt (területben vagy népességben) társadalomra alkalmazzuk (például a világ népessége, vagy egy országon belüli, immigráció nélküli népesség) akkor azt jelenti, hogy a legnagyobb társadalmi egységekből exponenciálisan sokkal kevesebb van, mint a kisebbekből. Ez a szabály meglepően igaz országon belüli városokra is (pl. Bukarest -> Kolozsvár, Temesvár -> Iași, Konstanca, Craiova, Galac, Brassó -> … ). Ezt az összefüggést matematikailag egy (egyébként a fent említett preferenciális csatolódási modell – preferential attachment – ami ilyen típusú skálafüggetlen – scale-free – hálózatot eredményez is ez alapján definiálható) hatványtörvénnyel (power law) írhatjuk le. Ez röviden annyit tesz, hogy a magyarázó és a magyarázott változó logaritmusai lineárisan függenek egymástól.

Ezt szem előtt tartva megvizsgáltuk a székelyföldi diaszpóra városaiban élők számának és a célvárosaik méretének (ott élő székelyföldi emigránsok száma alapján) közötti összefüggéseket és egy hatványtörvényre illesztettük őket.

A viszonylag kis mintákon alapuló statisztiák meglepően jól illeszkednek a hatványtörvényhez. A városok külön-külön (bal oldali ábra) majdnem teljes mértékben követik a hatványtörvény egyenesét és az összesített eredmények (jobb oldali ábra) is meglepően jó korrelációt mutatnak – az első 16 pont maguk a városok, amik természetesen kivételek a szabály alól. A törvény minden 20 és 200 közötti székelyföldi lakosú városra igaz. Ez anyit jelent: a székelyföldi diaszpóra legnagyobb városában tartózkodók exponenciálisan többen vannak, mint a második legnagyobb városban tartózkodók, és így tovább, amíg a városok túl picik nem lesznek.

Ha a rangsort gyakoriságra cseréljük, akkor még szembetűnőbb a hatványtörvény szabályszerűsége (bár ide kapcsolódó kutatás és matemakailag indokolt magyarázatunk nincs rá!). Azaz a diaszpóra legnagyobb városából csak egy van, második legnagyobból egy néhány, és a legkisebbekől (egy-két személyes települések) meg nagyon sok.

Bár a lineáris preferenciális csatolódási elve megengedné a kisebb városok aránybeli növekedését, és a hálózatmodell algoritmusának alkalmazásával használhatnánk a diaszpóra jövőbeli növekedésének megjósolásához, a rangsor-méret szabály hálózatelméleti boncolgatása – bár igencsak érdekes téma – még várat a mélyebb tanulmányozásra. Ennek eddig főként az adatok elérhetősége szabott gátat, ám az itt bemutatott közösségi-média bányászatra alapozó eljárások egy alternatív lehetőséget nyújtanak erre – jóllehet erre csak az elmúlt 2-3 évben nyílt valós elérhetőség. Megtörténhet, hogy a városok esetében a hálózatnövekedési szabály erősebb, mint lineáris (pl. exponenciálisan preferenciális csatolódás), ám ez nagyon sok bizonytalan kérdést vet fel és tanulmányozása nagyon komoly kutatást igényel.

Éppen ezért egy egyszerű lineáris modell alapján rávetítettük a teljes lakosságot a Facebook-mintákra, hogy megkapjuk Székelyföld hozzávetőleges, de teljes diaszpóráját. A fent levezetett gondolatmenet alapján, a nagyvárosoknak a valóságban nagyobbaknak kell lenniük és a kisvárosokban egyrészt kevesebben vannak, másrészt pedig valószníüleg, új eddig meg nem jelölt helyeken jelennének meg pöttyök. Tovább a marosvásárhelyi minta kis százalékos aránya ebben az esetben a maroszvásárhelyi hibaküszöböt megemeli, kiváltképp a kis települések esetében.

Teljes székelyföldi diaszpóra

Hargita,Kovászna és Maros megye városaiból elszármazottak szerte a világban

(interaktív – teljes képernyő, statikus)

Az így nyert adatok alapján, a 430118 fős székelyföldi városi lakosság 77.2%-a (332200 fő) él az ország határain belül és 97918 emigráns – ebből 34 ezer Kolozsváron – és ezzel egyáltalán nem vagyunk messze más statisztikusok becslésétől (akik 1987-2004 között számoltak!) – egyszerű Facebook adatok alapján! Példaként, Csíkszereda papíron ~38.000-es lakossága így 21461-re módosul, ebből 14481 “törzsgyökeres” csíki. Romániában, Hargita megyén kívül még 6300 csíki él, majd’ 3000 Kolozsvárott és 1500 Marosvásárhelyen. Az országon kívülre 9800(!) csíki jut, ebből Magyarországon 5000-en laknak. A többi székelyföldi város esetében is hasonló az eloszlás.

Angliában 11762 székelyföldi keresi a kenyerét – ebből Londonban 4100 (Sok magyar médium a magyarországi londoniakat százezerre becsüli – ehhez képest ez a becslés meglepően jól tartja a székelyföldi-magyarországi lakosságarányokat!). Németországban 15466-an dolgoznak, laknak, tanulnak, egyenletesen eloszolva Bajorország-szerte. Magyarországot 36425-en választották, ebből majdnem fele a fővárost. Az Egyesült Államokban 4356, Kanadában 976, Spanyolországban 3424, Olaszországban 5605, Svédországban 1280, Dániában 2099, Ausztriában 3308, Franciaországban 1441, Svájcban 1684 székelyföldi próbál jelenleg szerencsét. Ezennel mindenkinek mindenhez sok sikert és kitartást kívánunk! Meg persze az otthoniaknak is. Főleg 😉

Ne feledjük, hogy:

Az elemzés teljes mértékben és előirányozottan publikus Facebook-adatokon alapszik.

A Facebook-felhasználók demográfiája majdnem teljesen biztosan nem adja vissza a valós székelyföldi demográfiát.

Ugyanakkor a külföldön élők talán nagyobb eséllyel használnak Facebookot, ezáltal növelve a külföldi adatok hitelességét.

A külföldön élők talán nagyobb eséllyel állítják be a jelenlegi tartózkodási helyüket.

Nem mindenki adja meg a valós lakhelyét

Elírt (és a Facebook által automatikusan nem beazonosított) településnevek geokódolási hibákat vezethetnek be – mind a forrás, mind a céltelepülések esetében

Az elemzés kizárólag csak 16 Hargita, Kovászna és Maros megyei város adatainak alapján készült. E városok összesített lakossága a 2011-es romániai népszámlálás alapján 430118. Székelyföld lakossága 2014-ben 858466, a három megye összesített lakossága pedig 1119583 volt.

Míg a lakosságadatok frissek, a találatok kivándorlása akár évekkel ezelőtt is történhetett. Mivel a Székelyföldi városok lakossága köztudottan jelentősen csökkent az elmúlt két évtizedben, valószínű, hogy a kivándorlók egy része valós kivándorló és nem szerepel már a népességi nyilvántartásban. Ezt az eredményezi, hogy a emigráció valós mértéke valamivel kisebb , mint azt az elemzésünk mutatja.

, mint azt az elemzésünk mutatja. A publikus Facebook adatok sok bányászott profilon nem csak a jelenlegi tartózkodási helyet rejti, hanem a személyek foglalkozását, munkahelyét, oktatását is. Adatfeldolgozás szempontjából ez valóságos aranybánya: egy jövőbeli bejegyzésben megvizsgáljuk, hogy milyen munkakörben dolgoznak külföldön (vagy éppen otthon) ezek az emberek és milyen oktatással a hátuk mögött, valamint, hogy ezek összefüggenek-e egymással.

UPDATE: Platon Arnold barátom – az erdélyi térkép- és adatvizualizációs guru – egy picit tovább maszírozta a fenti adatsorokat. Bemutatom mire jutott (az alábbi infografikonok és a szöveg is az ő munkája – kisebb hozzátoldásokkal):

Ha az egyes városokat célországaik eloszlása szerint oszlopgrafikonokon ábrázoljuk, könnyen észrevehetjük, hogy a többségben román ajkú Maroshévíz, illetve Balánbánya szülöttei az újlatin nyelveket beszélő országokban (FR-Franciaország, ES-Spanyolország, IT-Olaszország) túlreprezentáltak. Tudva, hogy a román nép nyelvileg újlatin, kulturálisan frankofil, míg a magyarok inkább a német befolyásoltságú közép-európai kulturával azonosulnak, érdemes megnéznünk, hogy van-e összefüggés a városok etnikai összetétele és a hozzárendelt kulturáis gyökerek, illetve a választott célországok között – és nyilvánvalóan van. Hogy erre rámutassunk, az adathalmazból kiszűrtük a Franciaországba, Spanyolországba és Olaszországba, illetve Németországba, Ausztriába és Svájcba vándoroltakat (bár Svájc etnikailag egyharmad újlatin – francia, olasz és rétoromán – történelmi és politikai magja a német részen van, és a lakosság kétharmada németakjú).

A székelyföldi városokat a román-magyar etnikai összetételük szerint rendeztük (a 2011-es népszámlálás alapján), illetve a diaszpóráik összetételét a germán avagy újlatin célországok szerint. Amint az várható volt, viszonylag erős korreláció van a városok etnikai összetétele és a választott célországok nyelvi-kulturális gyökerei között. Az adatokra illesztett regressziós görbe szerint (R2) a nyelv az országválasztás 57%-ért felelős!

Két, Székelyföldre specifikus dologra szeretnénk még felhívni a figyelmet: sok abszolút magyarajkú (95%-nál több) város nem illeszkedik teljesen a vonalra, mivel a se nem germán se nem újlatin Magyarország a fő kivándorlási célpont. Ugyanakkor Segesvár (és kisebb mértékben Szászrégen) diaszpórája sokkal inkább germánabb, mint azt a román-magyar etnikai összetétel jósolná – természetesen az évszázados szász kultúra hagyatékának nyomaként.

ADATOK + KÓD: A bejegyzéshez felhasznált adatokat a Facebook közösségi oldal Graph-Search keresőjének automatizálásával gyűjtöttük, ezzel a Microsoft Excel macroval és egy automatizált Internet Explorer böngészővel. Két, egymástól független adatgyűjtési epizódot vezettük le, egy teljesen friss, valamint egy többéves régiséggel rendelkező felhasználóval. Az adatbányászat egy Core i5-ös, 4GB memóriájú Windows 10-en futó, hordozható számítógépen 48 órát vett igénybe. Az így kapott adatokat JSON formátumba dolgoztuk fel ezzel a Jupyter munkafüzettel, pandas használatával. Az adatok tisztogatása és normalizálása 24 órát vett igénybe. Ezután az interaktív vizualizációkat d3.js és matplotlib felhasználásával készítettük, 48 óra alatt. A színeket colorbrewer segítségével választottuk és a Righteous betűtípust használtuk. A háttérkutatás és a bejegyzés szerkesztése 16 órát tartott. Az eredmények a Székelyföldi diaszpóra interaktív, világtérkép adatvizualizáció, geolokalizált tortadiagramokkal (interaktív – teljes képernyő, statikus). A geolokalizációt a Google Maps Geocoding API és pyegocoder Python bővítőcsomag segítségével hajtottuk végre. A tortadiagramok SVG nyelvben vannak rajzolva, ebben ez a blogbejegyzés is segített. Ugyanez Európa, Amerika, Románia és Székelyföld felbontásában. Európa esetében külön tárgyaltuk Maroshévíz és Balánbánya, Csík-, Gyergyó- és Udvarhelyszék, valamint Háromszék és Marosszék esetét. Elkészítettük továbbá székelyföldi városok migrációs arányairól szóló adatvizualizációt (interaktív – teljes képernyő, statikus), a célországok (interaktív – teljes képernyő, statikus) és Románián belüli célmegyék (interaktív – teljes képernyő, statikus) Sankey folyamatábráját, valamint a Székelyföldi diaszpóra rangsor-méret illetve gyakoriság-méret szabályainak adatinfografikáit. Az elemzés végső elemét a Teljes székelyföldi diaszpóra interaktív adatvizualizációja jelenti (interaktív – teljes képernyő, statikus). Ha tetszett a bejegyzés, vagy bármilyen kérdésed, hozzáfűznivalód van, Like-olj, Oszd meg, Kommentelj, és Iratkozz fel! Ha tetszenek az ehhez hasonló vizuális adatelemzések, itt támogathatod a blogot.