Lež má krátké nohy, praví optimistické české přísloví. Angličané jsou pesimističtější, jejich průpovídka zní: „Lež obletí svět, a za ní kulhá pravda.“ Zdá se však, že pesimismus je v případě šíření pravdivých a nepravdivých informací na místě.

„Dokončili jsme největší dosud provedenou dlouhodobou studii šíření nepravdivých zpráv,“ představil výzkum svůj a svých kolegů Sinan Aral, profesor informatiky na Massachusettském technologickém institutu. „Studovali jsme všechny ověřené zprávy, pravdivé i nepravdivé, které se šířily na Twitteru od jeho založení v roce 2006 až do roku 2017.“

Nepravda se šířila rychleji a má na síti větší dosah než pravda.

Hlavní poznatky shrnují autoři takto: „Nepravda se šířila významně rychleji, hlouběji a měla větší dosah než pravda.“ Platilo to pro všechny kategorie zpráv, nejvýraznější byl ale tento rozdíl u zpráv politických, zpráv o terorismu, katastrofách nebo o vědě.

Obálka magazínu Science z 9. března 2018

Studii „Šíření pravdivých a nepravdivých zpráv on-line“, která je unikátní svým ohromným rozsahem i pečlivou snahou o objektivní přístup k tématu, publikoval prestižní vědecký časopis Science (PDF, doplňkové materiály). Navzdory tomu, že se tzv. „fake news“ dostaly do popředí pozornosti v posledním roce, není studie vědců z MIT úzce zaměřená na fenomén falešných zpráv. Naopak, výzkumníci si dávali pozor, aby se tomuto „dnes již prázdnému“ termínu vyhnuli. Místo toho popsali obecné principy šíření zpráv na ohromném množství dostupných dat. Využili k tomu analýzu velkých dat, lidské ověřovače i počítačovou analýzu emocí.

Spoluautor studie Sinan Aral shrnuje publikované výsledky:

Problém první Jak získat důvěryhodná data o šíření

To, že se na internetu šíří nepravdivé informace, ví každý, a většina lidí se dokonce dokáže shodnout na tom, že tyto informace mohou být škodlivé nebo nebezpečné. Například tím, že šíří paniku, plýtvají zdroji záchranářů během přírodních katastrof nebo mohou poškodit osoby či firmy, které se stanou terčem nepravdivých pomluv. Dosud ale neexistovala komplexní studie, která by se podrobně podívala na to, jak se na internetu šíří pravda a lež (respektive „nepravda“, neboť lež je úmyslná nepravda, a úmysl je těžké hodnotit).

„Všechny nám známé studie, které se doposud na toto téma uskutečnily, se týkaly buď šíření jedné konkrétní zprávy, nebo konkrétní události (třeba šíření falešných zpráv během Bostonského maratonu 2013), nebo velmi malého vzorku,“ vypočítává Aral nevýhody dosavadních výzkumů.

Výzkumníci s pomocí Twitter API analyzovali tzv. „kaskády“ tweetů, tedy zmapovali, jakým způsobem se zpráva šířila pomocí retweetů, jak dlouho to trvalo a kolik lidí jednotlivou zprávu šířilo.

„My jsme se namísto toho rozhodli udělat ucelenou analýzu všech nepravdivých zpráv, které kdy byly sdílené a šířené na síti Twitter, a to od založení této služby v roce 2006 až do roku 2017,“ vysvětluje Aral.



Dohodli se s Twitterem na přístupu k datům o všech tweetech v historii. Kromě toho také zjistili, kdo koho kdy na Twitteru sledoval, a na základě této znalosti mohli s využitím vlastních algoritmů pro libovolný tweet sestavit tzv. kaskádu tweetů: časový záznam toho, jak se konkrétní zpráva šířila po síti, od člověka k člověku.

Kaskáda může být malá, tedy obsahovat pouze jediný tweet, který nikdo dále nesdílel, nebo může mít několik „generací“ a větví. Jedna zpráva může vytvořit více kaskád (to v případě, že jednu zprávu nezávisle na sobě tweetuje více lidí).

Nepravdivé zprávy (červeně) měly větší dosah než pravdivé (zeleně). Politické zprávy (plná čára) měly obecně větší dosah než zprávy nepolitické (přerušovaná čára). Graf ukazuje, že přibližně jedno procento kaskád (řetězů sdílení) mělo více než tisíc sdílení.

„Pokud vím, je naše studie první svého druhu, a určitě je to největší práce o šíření nepravdivých zpráv na internetu,“ zdůvodňuje Aral výjimečnost studie.

Ale samotná data o tweetech nemohla odpovědět na otázku, jak se liší šíření pravdy od nepravdy. Twitter má ve své databázi jen informace o tom, kdo zprávu šířil, kdy a s jakým komentářem. Nemá samozřejmě žádné informace o tom, zda je daná zpráva pravdivá či nepravdivá.

Problém druhý Jak označit pravdivé a nepravdivé zprávy

Profesor informatiky Sinan Aral a jeho student a kolega se o nepravdivé zprávy šířené na internetu začali zajímat téměř před pěti lety. Bylo to právě po již zmíněném Bostonském maratonu, jelikož tento teroristický útok přímo zasáhl jejich univerzitu MIT v Bostonu: „Celý areál univerzity tehdy zavřeli a nesměli jsme vycházet,“ vzpomíná Aral. „Bylo téměř nemožné získat informace o tom, co se děje, a tak jsme se obrátili na sociální sítě, jak se to dnes dělá.“

Tehdy se Soroush Vosoughi, v té době Aralův doktorand, začal zajímat o to, jak se na Twitteru liší nepravda od pravdy. Hodně zpráv, které se o Bostonském maratonu šířily, bylo nepřesných nebo nepravdivých. „Přivedlo nás to k tomu, že jsme se - dávno před tzv. fake news - zamysleli nad tím, jaké jsou důsledky šíření pravdivých a nepravdivých zpráv.“

Jenže jak rozpoznat, co je pravda a co ne? Pokud chtěli výzkumníci analyzovat opravdu velké množství dat, bylo nemyslitelné ručně ověřovat každou jednotlivou zprávu. Namísto toho tedy vědci využili šesti již existujících nezávislých organizací, které se ověřováním pravdivosti zabývají:

snopes.com

politifact.com

factcheck.org

truthorfiction.com

hoax-slayer.com

urbanlegends.about.com.

Odtud vzali výzkumníci databázi pravdivých, nepravdivých a smíšených zpráv šířených on-line (v originále: true, false, mixed). Vzájemným porovnáním jejich výsledků zjistili, že jde o celkem spolehlivé zdroje, které se shodují v 95 - 98 % případů. Takto získali výzkumníci více než sto tisíc jednotlivých zpráv, u kterých znali jejich pravdivost či nepravdivost, a mohli pak v databázi tweetů hledat doklady o tom, jak se tyto konkrétní zprávy šířily na síti. Nebylo přitom důležité, zda daný člověk napsal zprávu do tweetu nebo v tweetu odkazoval například na CNN, New York Times nebo na Fox News, důležité bylo, o kterou zprávu se jednalo.

Studie mimo jiné ukázala, jaký je vztah mezi poměrem pravdivých/nepravdivých tvrzení šířených daným médiem a tím, jaké procento Američanů médiu důvěřuje. Nejdůvěryhodnější CNN má (podle reprezentativního dotazníku z roku 2014 na 2 901 respondentech) důvěru 54 % Američanů. Vosoughi a jeho kolegové dali tuto důvěryhodnost do kontrastu s tím, jak tato média šířila ověřeně pravdivé/nepravdivé zprávy na Twitteru.

Je samozřejmě možné, že výše uvedené fact-checkingové organizace samotným výběrem zpráv, které ověřují, vlastně ovlivňují výsledky, ke kterým dojdou. Vědci proto ještě pro jistotu našli 13 tisíc zpráv, které ověřené nebyly, a zaplatili studentům, aby tyto zprávy ověřili: „Věříme, že jsme tím zabránili případnému zkreslení vzniklému tím, že spoléháme na šest nezávislých organizací. Jde nám o transparentní ověření toho, co je pravdivé a co ne, aniž bychom zabíhali do debat o tom, které zdroje zpráv jsou důvěryhodné a které ne,“ píší výzkumníci v doplňkových materiálech.

Když tedy vědci získali databázi výroků, u kterých znali jejich pravdivost, mohli zjistit, jak se po síti šíří zprávy pravdivé a jak se šíří ty nepravdivé.

Problém třetí Jak vysvětlit, že se nepravda šíří rychleji?

Výsledky byly jednoznačné a znepokojující. Bez ohledu na kategorii zpráv se nepravdivé zprávy šířily rychleji než zprávy pravdivé. Obecně měl tweet, který obsahoval nepravdivou informaci, o 70 % větší šanci, že se rozšíří dál, než tweet s informací pravdivou.

Nepravda se na Twitteru šíří rychleji a dále než pravda. Zasáhne tak více uživatelů a v průměru má o 70 % větší šanci na „retweetování“.

Nepravdivé informace se také šířily rychleji a déle. Zatímco u některých kategorií zpráv - jako třeba u přírodních katastrof - se obvykle šířila jen několik dní, u zpráv z politiky nebo vědy může trvat i několik týdnů, než se přestane šířit.

Nepravdivá zpráva má o 70 % větší šanci, že bude sdílena dále. Nepravda se šíří rychleji a dostane se k více lidem.

Ve velkém se nepravdivé informace začaly na Twitteru rozšiřovat během americké prezidentské kampaně v roce 2012. V roce 2014 zase vědci zaznamenali rekordní nárůst „smíšených zpráv“ (zpráv kombinující pravdivá a nepravdivá tvrzení) v souvislosti s anexí ukrajinského Krymu Ruskou federací. Během předvolební kampaně 2016 je pak na Twitteru vidět velký nárůst jak pravdivých, tak i nepravdivých zpráv. Ty nepravdivé se ovšem šířily snáze a dostaly se k více lidem.

Jak probíhala analýza 4,5 milionů tweetů od roku 2006 do roku 2017, ve kterých se šířila ověřitelně pravdivá/nepravdivá zpráva. Největším spouštěčem politických zpráv obsahujících prokazatelně nepravdivé informace byla volba amerického prezidenta v roce 2016 a 2012. Grafy také ukazují, že ačkoli nepravdivé zprávy vedou co do celkového množství sdílení, ty úplně nejsdílenější zprávy na Twitteru jsou častěji pravdivé než nepravdivé.

Když ale vědci chtěli vysvětlit, proč na síti boduje nepravda na úkor zpráv pravdivých, narazili na překvapení: „Naše první hypotéza byla, že se na Twitteru rychleji šíří zprávy, pokud je sdílejí lidé, kteří mají hodně fanoušků (followerů), nebo pokud je sdílí lidé, kteří patří mezi verifikované uživatele (označené modrou ikonkou „ověřeno“, pozn. red.). Mysleli jsme si, že zprávy se dostanou k více lidem proto, že je šíří lidé s velkou čtenářskou základnou,“ vzpomíná Aral.

„Ale bylo to přesně naopak. Lidé, kteří sdílí nepravdivé zprávy, mají obecně vzato výrazně méně následovníků, jsou na Twitteru méně dlouho, obvykle nejde o ověřené účty,“ popisuje Aral. „Dospěli jsme tedy k tomu, že nepravdivé zprávy se šíří více než pravdivé navzdory těmto zdánlivým nevýhodám.“

Mohou snad za šíření nepravdivých zpráv internetoví boti, tedy automatické programy vydávající se za reálné uživatele Twitteru? Výzkumníci za pomocí pokročilého programu BotOrNot na detekci botů rozfiltrovali aktivitu lidských a ne-lidských uživatelů. „Ale i když jsme odstranili aktivitu botů, výsledky zůstaly stejné. Přestože roboti urychlili šíření zpráv, urychlili šíření zpráv pravdivých i nepravdivých, a to přibližně stejnou měrou,“ píše se ve studii. Ať tedy výhodu nepravdy nad pravdou způsobilo cokoli, výzkumníci věděli, že po tom budou muset pátrat přímo u lidí, kteří tyto zprávy šíří.

Problém čtvrtý Jak změřit, co lidé po přečtení cítí

„Nenechte si dobrý příběh zkazit pravdou!“ praví novinářský bonmot připisovaný Marku Twainovi. Právě ta „nepříjemná“ schopnost pravdy zkazit dobrý příběh vedla výzkumníky k formulaci hypotézy o neotřelosti: „Když nejste svázání realitou, můžete napsat v podstatě cokoli, a je pak jednoduché napsat něco překvapivého a neotřelého.“

Tato myšlenka originality (tzv. novelty hypothesis) není sama o sobě nová. „Originalita přitahuje lidskou pozornost, pomáhá lidem k lepšímu rozhodování a povzbuzuje je ke sdílení informací, protože nové originální poznatky zlepšují naše porozumění světu,“ píší vědci. Informace, která je nová a originální, je pochopitelně vysoce ceněná. Proto člověk, který s takovou originální informací přijde, zvyšuje svůj status, vytváří dojem, že ví, o co jde a má přístup k veřejnosti dosud neznámým informacím.

Výzkumníci z MIT se tedy rozhodli ověřit, zda by tato hypotéza mohla vysvětlit, proč se nepravda šíří na síti lépe a rychleji. Náhodně vybrali vzorek pěti tisíců uživatelů, kteří šířili pravdivé nebo nepravdivé zprávy, a analyzovali, jaké tweety tito uživatelé mohli na Twitteru vidět v 60 dnech před tím, než zprávu sdíleli. Poté vědci vytrénovali algoritmus, aby rozpoznal, zda je zpráva uživatele tematicky blízká či vzdálená zprávám předcházejícím. Výsledek potvrdil hypotézu: nepravdivé zprávy byly signifikantně originálnější napříč metrikami.

S tímto konstatováním se ale vědci nespokojili, a rozhodli se ještě změřit, jakým způsobem uživatelé na Twitteru reagovali na sdílené zprávy, pravdivé i nepravdivé. K tomu využili systém pro analýzu emocí v anglickém jazyce: vztek, strach, očekávání, důvěra, překvapení, smutek, radost a znechucení.

„Zjistili jsme, že nepravdivé zprávy častěji vyvolaly emoci překvapení, což podporuje hypotézu o originalitě,“ píší vědci. Dále nepravdivé zprávy vyvolaly častěji znechucení. „To je velmi typická, velice lidská reakce, to znechucení,“ myslí si Aral. Producent nebo šiřitel nepravdivé, smyšlené zprávy, počítá s touto emocionální reakcí, která zprávě pomáhá v dalším šíření.

Profesor Sinan Aral z MIT v podrobném rozhovoru o studii:

To, že se emocionální zprávy snáze šíří, není nic nového. Už v 19. století někteří vydavatelé novin zjistili, že v boji o čtenáře se „vyplatí“ hrát na emoce, zatímco pravdivost sama o sobě neprodává. V době sociálních sítí je důraz na emoce ještě akcentován: „Falešné zprávy obecně mívají vyšší virální potenciál, obvykle se zaměřují a pracují s vyhrocenými a šokujícími emocemi, clickbait titulky či přitažlivým (nebo děsivým) obrazovým doprovodem,“ řekl nám Petr Nutil, zakladatel serveru Manipulator.cz. “A to všechno nakonec přitahuje pozornost lépe než suchá fakta.“

Problém pátý Co s tím?

Vosoughiho tým z MIT si dal záležet na tom, aby byla jejich studie precizně podložená. Tam, kde předpokládali pochybnosti publika, raději zvolili několik nezávislých postupů nebo zdrojů, které následně srovnali. Výsledkem je unikátní analýza, která celkem přesvědčivě ukazuje na to, že lidé mají na internetu tendenci sdílet nepravdivé zprávy rychleji než zprávy pravdivé.

To samozřejmě neznamená, že by nutně lidé na základě těchto nepravdivých zpráv změnili svůj názor. Je klidně možné, že nepravdivé zprávy šíří lidé především proto, že tyto zprávy potvrzují to, co už si myslí.

Proč je tak těžké změnit názor? Proč tak málo záleží na faktech?

Tým vědců z MIT apeluje především na to, aby jejich studie nezůstala osamocena. „Je potřeba více výzkumů. Nejen na téma toho, co se děje a jak se nepravdivé zprávy šíří, ale také toho, zda existují způsoby, kterými by bylo možné šíření nepravdivých zpráv zastavit.“

Nepravdivé zprávy mají totiž podle Arala opravdu hrozivý potenciál: „Důsledky mohou být dramatické a katastrofální. Pořád ale nevíme dost o tom, co se děje a co můžeme udělat pro to, abychom lidem pomohli poznat nepravdu od pravdy.“

Je docela možné, že žádné jednoduché řešení neexistuje. Filtrování zpráv bude vždy podezřelé a platforma, která je bude filtrovat, bude velmi těžko obhajovat, proč mají zrovna její správci „patent na pravdu“. A zatímco někteří doufají, že označování podezřelých a pochybných zpráv by mohlo posílit kritické myšlení příjemců, ve skutečnosti má tento přístup několik zásadních nedostatků.



Červená vlajka upozorňující na pochybnou zprávu k ní paradoxně může přilákat více pozornosti, zjistil Facebook. A výzkumníci z Yale University upozornili na další nevýhodu: pokud jsou některé nepravdivé zprávy označeny jako nepravdivé, lidé si na tyto nálepky zvyknou. Snáze pak naletí na nepravdivou zprávu, která tuto nálepku ještě nemá, protože čtenář může implicitně předpokládat, že „kdyby to nebyla pravda, dali by tam nálepku.“

Profesor Sinan Aral namísto toho navrhuje transparentnější způsob boje proti nepravdivým zprávám: „Mohli bychom o nálepkách u zpráv přemýšlet jako o etiketě na potravinách. Když nakupuji v obchodě, na etiketě si přečtu, kolik má potravina kalorií nebo tuku.“ U článků na internetu by zase nálepka mohla říkat, kdo článek napsal nebo zda článek odkazuje na zdroje. „Ale není to univerzální lék, protože není jasné, jak se shodnout na tom, co to znamená, že je zpráva kvalitní nebo ne, v tomto ohledu nepanuje celospolečenská shoda,“ uznává Aral.

Přinejmenším je ale v moci platforem, aby bojovaly proti tvůrcům falešných zpráv, kteří na této tvorbě vydělávají. Typickým příkladem jsou fake news farmy studentů v Makedonii publikující smyšlené zprávy. Jejich tvůrci využívají zájem o politiku, vyrábějí falešné virální zprávy a profitují ze zobrazených reklam. Dalším nápadem je přechod seriózních médií na předplatné, což by zvýšilo tlak na kvalitu a snížilo tlak na tvorbu virálních zpráv za každou cenu. Podle dalších by mohla v boji s nepravdou pomoci i umělá inteligence, což s sebou ale nese i velmi kontroverzní vedlejší efekty a otázku zodpovědnosti pouze přesouvá.

Obecně je zřejmě jediným dlouhodobým řešením kultivace mediální gramotnosti a pěstovat tak schopnost lidí ověřovat si informace. To ale není jednoduché, zvláště v prostředí on-line sítí, kde je zdánlivě tak málo času na rozhodování. Podle Arala ale stojí za to nerezignovat a povzbuzovat kritické myšlení: „Bude to vždycky nekonečná bitva pravdy s nepravdou. Myslím si, že pokud dovolíme, aby byla společnost pohlcena nepravdivými informacemi, může nás to úplně paralyzovat, a to způsobem, který si zatím třeba ještě nedokážeme představit.“