Sándor, József, Benedek, zsákban hoznak meleget – szól a mondás. De vajon tényleg hoznak? Igen, 65%-ban. Ebben a bejegyezésben több, mint hatvan évre visszamenő időjárás-adatsorral vizsgáljuk meg a népi időjóslatokat. A II. székelydata adavizualizációs verseny nagyfelbontású időjárás-adatsorát felhasználva, 50 mondást fordítottunk le az adatok nyelvére és vizsgáltuk meg az érvényességüket.

Minden jövendölés két részből áll: egy feltétel: “Ha Katalinkor kopog” – azaz ha november 25-én az átlagosnál hidegebb az idő, és egy jóslat: “Karácsonykor locsog” – azaz a december 24-27-i periódusban az átlagosnál melegebb idő várható.

Persze sok mindent meg lehetne vizsgálni az adatok longitudinális (időbeli) változását illetően – például, hogy a mekkora szerepet játszik a klímaváltozás – de összességében azt mondhatjuk el, hogy a magyar népi időjóslatok sajnos csak egy kicsit jobbak a pénzfeldobásnál: az átlagos találati arány 56%. Természetesen a hagyományos tavasz-vagy őszkezdő napok jóslatai jönnek be a legnagyobb arányban, de a januári fagyjövendölések is 70% fölött teljesítenek. Az ismertebb mondások az átlag fölött teljesítenek: Sándor, József, Bendek 65%-ot kap, Medárd 66%-ot, László 79%-ot, Szent Anna 75%-ot, Péter 68%-ot, Márton 62%-ot, Katalin 67%-ot.

És akkor íme, a részletes eredmények. Mindenik időjóslat érvényességét két függőleges tengely segítségével mutatjuk be, ahol a feltétel és a jóslat teljesülését mutatjuk, évente:

ADATOK + KÓD: A mondásokat erről , erről és erről a weboldalról gyűjtöttük össze. Mivel ezek magyar nyelvterületről származó mondások, az adatokat 10 erdélyi és 18 magyarországi településen elhelyezett időjárás-allomás adataiból raktuk össze. Ezeket most összesítve mutatjuk be, de itt elérhetőek országonként is. Minden év egy adatpontot jelent, településenként. Az idősorok a 50/70-es években kezdődnek és 2019-ig tartanak. Ez alapján egy népi időjóslat érvényességének megállapítására általában ≈60 év x ≈28 település → ≈1680 adatpont áll rendelkezésre.

A klíma-adatok forrása a II. székelydata adatvizualizációs verseny adatai. A nagyfelbontású, hosszútávú időjárás-adatok általában mindig fizetősek. Kivételt képeznek a NOAA (Amerikai Éghajlat- és Óceántanulmányozási Ügynökség) adatbázisában világszerte regisztrált időjárás-állomások adatai. Ez általában több évre visszamenőleg, óra felbontásban jelenti a hőmérséklet, látótávolság, szélsebesség, csapadék mennyisége (az elmúlt egy órában/napban), jégeső, hó észlelése, hóréteg vastagsága értékeket. Ezeknek a mennyiségeknek a megjelenítésére az infografikákon a következő ikonokat használtuk (a használt betűvel kicsit másképp néznek ki):

Hőmérséklet: ♨️ hidegebb:✨️ melegebb: ☼

Szél: ⛵️ gyengébb: ☘ erősebb: 🌀

Eső: ☂️ kevés: 🌂 sok: ☔️

Látótávolság: ⛅️ borús: ⛈️ tiszta: ☀️

Hó: ❄️ kis mennyiség: ⚪️ nagy mennyiség: ☃️

Hóvastagság: ⛷️ sekély: ⚪️ mély: ⛄️

Jég: ✴️ kisszemű: ⚪️ nagyszemű: ⭕️

Ezzel és ezzel a Jupyter notebook-kal gyűjtöttük be a klíma-adatokat, és ezzel dolgoztuk fel őket. Csak azokat az időjárás-állomásokat és éveket tartottuk meg Románia és Magyarország adataiból, amelyeknél naponta legalább 4 érték, havonta legalább 6 nap és évente legalább 3 hónap rendelkezésre állt. Ezután az állomásokat szűrtük, hogy földrajzilag egyenletes eloszlást és egy reprezentatív képet kapjunk. Az infografikákat matplotlib-el készítettük, a hegedűplotok kivételével. Ezek seaborn-al készültek. Az plottolás teljes forráskódját itt találod.

És végül pedig: ❤️ Köszönöm, hogy elolvastad ezt a vaskos bejegyzést! Még több adatvarázslatért olvasd el a sztorit, és ha megteheted támogasd a székelydatát a láblécen megjelölt opciók egyikén: Patreon-on, Paypal-on, vagy küldhetsz kriptót is!

Itt a mondások teljes listája, a vizsgálható hipotézisre való fordításokkal (természetesen nem lehet mindent tökéletesen lefordítani, így a legtalálóbb közelítéseket használtuk):