Internetin jättiläiset tekevät valintoja, joiden perusteluja emme tunne. Väitöskirja: "Jos olet puolueellinen, ihmiset pitävät sinusta ja saat verkostossasi keskeisemmän aseman."

Tietokoneet ovat kaapanneet vallan. Ne humisevat jättimäisissä tietokonesaleissa ja pyörittävät salaisia algoritmejaan.

Kenen ajatukset nousevat Facebookissa esiin, kenen mielipide on Google-haun kärjessä? Algoritmit tekevät valintoja, mutta perusteluja valinnoille ne eivät paljasta.

Kysymyksiä kyllä riittäisi.

Helsingin Sanomat teki taannoin erikoisen havainnon. Google-haku “mitä tarkoittaa kansallissosialismi”, nostaa hakutulosten kärkeen Pohjoismaisen Vastarintaliikkeen sivut. Ykköstilan sai tietopalvelu Wikipedia, mutta hakutulosten kakkospaikalla on tämä käräjäoikeuden lakkautettavaksi määräämä äärijärjestö. (Kokeile. (siirryt toiseen palveluun))

Me emme tiedä, miksi Googlen algoritmi toimii näin. Hakumoottori tuottaa sille kymmenien miljardien eurojen mainostulot joka vuosi, eikä yhtiö paljasta liikesalaisuuksiaan.

Googlen maajohtaja Antti Järvisen mukaan asiassa ei ole ongelmaa (siirryt toiseen palveluun). Ongelma on kuitenkin ilmeinen, eikä se koske vain Googlea. Millaisia tulkintoja algoritmit tekevät puolestamme?

Toinen esimerkki. Presidentinvaalien alla Uutissuomalainen (siirryt toiseen palveluun) ja MTV (siirryt toiseen palveluun) kertovat, että Laura Huhtasaari (ps.) on heidän vaalikoneidensa ylivoimaisesti suositelluin ehdokas noin 40 prosentin osuudella. Äänestivätkö suomalaiset siis istuvaa presidenttiä vaikka olivat Huhtasaaren kanssa enemmän samaa mieltä? Vai oliko vaalikoneissa häntä suosiva vinoutuma?

Se olisi pelottava vaihtoehto. Me nimittäin uskomme näitä koneita. Tilastokeskuksen mukaan (siirryt toiseen palveluun) viime eduskuntavaalien aikaan joka toinen suomalainen käytti vaalikonetta ja yli puolet käyttäjistä kertoi vaalikoneiden vaikuttaneen oman ehdokkaan valintaan joko paljon tai jonkin verran.

Yle aloittaa artikkelisarjan, joka kertoo miten tietokoneiden algoritmit ja niiden käsittelemät suuret tietoaineistot vaikuttavat yhteiskuntaan, talouteen ja työelämään. Sarja nostaa esiin esimerkkejä siitä, miten tietotekniikan edistysaskeleet helpottavat elämämme ja auttavat tekemään entistä parempaa liiketoimintaa.

Sarjan ensimmäisessä osassa kysymme, uhkaavatko algoritmit demokratiaa.

"Jos olet puolueellinen, ihmiset pitävät sinusta"

Kiran Garimella Kimmo Hiltunen / Yle

Kiran Garimella on neljä vuotta Suomessa asunut Aalto-yliopiston tohtorikoulutettava. Viime vuodet intialaismies on selvittänyt kansainvälisen tutkimusryhmän kanssa sosiaalisen median polarisaatiota (siirryt toiseen palveluun). Väitöstilaisuus miehellä on edessään ensi viikon keskiviikkona.

Garimellan mukaan sosiaalinen media jakaa kansan vastakkaisiin ryhmiin, jotka eivät keskustele keskenään.

– Sosiaalisen median kaikukammioissa ihmiset elävät kuplissaan ja saavat tietoa, joka vahvistaa heidän ennakkokäsityksiään, hän sanoo.

– Yksi tutkimuksessa tekemämme uusi havainto on, että vain yhtä katsantokantaa edustava viesti saa paljon enemmän suosiota. Jos olet puolueellinen, ihmiset pitävät sinusta enemmän ja saat verkostossasi keskeisemmän aseman.

Garimella kaivaa esiin kuvan toissa syksyltä. Se on ote Yhdysvaltain presidentinvaalien yhteydessä käydyistä Twitter-keskusteluista (#USElections).

Twitter-viestit Yhdysvaltain valeista tunnukselle #USElections. Pisteet ovat ihmisiä, viivat edelleenlähetettyjä viestejä. Kiran Garimella

Kuvassa pisteet ovat ihmisiä ja viivat välitettyjä viestejä, eli retweettauksia. Toisaalta käyttäjän etäisyys ryppään keskustasta määrittyy sen mukaan, kuinka monta kertaa hänen viestejään on välitetty eteenpäin.

Menetelmä on monimutkainen, mutta kuva on selkeä. Yhdysvaltain vaalien aikaan Hillary Clintonin ja Donald Trumpin kannattajat elivät lähes täysin erillisissä todellisuuksissaan.

– Useimmat eivät nähneet Donald Trumpin nousua ennalta, koska he olivat jumissa omissa kuplissaan. Esimerkiksi liberaalissa kuplassa oltiin täysin varmoja, ettei Trump voi koskaan onnistua, Garimella sanoo.

Samanlainen epäterve jakautuminen näkyy myös abortteja ja aselakeja koskevissa keskusteluissa. Kaikkein jakautunein some-keskustelu käytiin kuitenkin tietokonepelialaa pari vuotta sitten järisyttäneen #gamergate-tunnuksen alla (kuva alla vasemmalla).

Twitter-keskutelut tunnusten #gamergate (vas) ja #gameofthrones alla. Kiran Garimella

Epäpoliittisista aiheista, esimerkiksi tv-sarja Game of Thronesista, keskustelua kyetään käymään yhdessä iloisessa ryppäässä (kuva yllä oikealla). Melko yhtenäinen rypäs syntyi myös suomalaisesta #Aktiivimalli-keskustelusta, jonka Garimella toimitti Ylelle tätä artikkelia varten (alla). Tosin tämä kertonee ainakin yhtä paljon Twitterin yksipuolisesta käyttäjäkunnasta Suomessa kuin suomalaisen keskustelun laadusta.

Twitter-keskutelu tunnuksen #Aktiivimalli alla. Pisteet ovat ihmisiä, viivat välitettyjä viestejä. Kiran Garimella

Garimellan mukaan polarisaation ja kuplautumisen vaikutukset yhteiskuntaan lisääntyvät sitä mukaa, kun yhä suurempi osa kansasta seuraa uutisia sosiaalisesta mediasta. Reuters Instituten mukaan (siirryt toiseen palveluun)sosiaalisen median kautta uutisia seuraa viikoittain yli puolet yhdysvaltalaisista ja hieman alle puolet suomalaisista. Ei ole yllättävää, että eniten somesta uutisia lukevat nuoret (siirryt toiseen palveluun).

Suomen 18–24-vuotiaista 29 prosenttia nimesi sosiaalisen median ja blogit pääasialliseksi uutislähteekseen.

Toimivaan demokratiaan kuuluu, että ihmiset peilaavat näkemyksiään ympäröivään maailmaan. Vastakkaiset poliittiset mielipiteet eivät ole ongelma. Ongelma on, jos käyttäjät eivät kohtaa verkossa muita kuin samanmielisiä.

Mutta kuinka iso osa tästä ilmiöstä on algoritmien vika?

Ihmisen vai koneen luoma kupla?

Syitä sosiaalisen median kupliin on kaksi:

Ensinnäkin ihmiset suuntautuvat luontaisesti samanmielisten seuraan. Tässä ei ole uutta – samalla tavalla ajattelevat ovat aina hakeutuneet enemmän tai vähemmän suurella todennäköisyydellä samoihin ravintoloihin, samoihin harrastuksiin ja samojen mediasisältöjen äärelle.

On selvää, että näin käy myös verkossa.

Toinen kuplautumisen tekijä on kuitenkin uusi. Algoritmit vahvistavat edellä kuvattua taipumusta. Ne seuraavat klikkauksiamme ja valintojamme ja tarjoavat meille yhä enemmän samankaltaista ja -mielistä sisältöä. Tavoitteena on, että käyttäjä viihtyy samanmielisten seurassa ja internetyhtiön liiketoiminta kasvaa. Samalla vähenee aito keskustelu ja empatia.

Kumman tekijän vaikutus on kuplautumisessa suurempi, ikiaikaisen ihmisluonteen vai uusien algoritmien? Garimellan mukaan tätä on mahdoton tietää.

– Algoritmit ovat kuin mustia laatikoita, joiden sisään eivät ulkopuoliset näe.

Esimerkiksi Facebookin algoritmiin ovat päässeet käsiksi lähinnä Facebookin omat tutkijat.

Paljonko Facebook leikkaa?

Vuonna 2015 julkaistiin tutkimus (siirryt toiseen palveluun), joka paljasti mielenkiintoisia yksityiskohtia sosiaalisen median luonteesta. Facebookin tutkijat olivat selvittäneet, miten palvelussa jaettiin politiikkaa, ulkomaantapahtumia sekä taloutta koskevia "kovia" uutisia.

Tutkijat havaitsivat, että liberaalien käyttäjien Facebook-kavereiden jakamista uutisista vain 24 prosenttia edusti vastakkaista, konservatiiviseksi tulkittavaa, näkökulmaa.

Toisaalta konservatiivisten käyttäjien ystävät jakoivat uutisia, joista 35 prosenttia edusti vastakkaista näkökulmaa.

Tämä oli kuitenkin vasta alkua. Kavereiden jakamat uutiset eivät päätyneet käyttäjien uutisvirtoihin sellaisenaan. Tutkijoiden mukaan Facebookin algoritmi muokkaa uutisvirtaa esimerkiksi sen perusteella, kuinka usein käyttäjä kirjautuu Facebookiin, paljonko hän viestii tiettyjen käyttäjien kanssa tai klikkailee tiettyjä uutislähteitä.

Algoritmin tekemien valintojen seurauksena vastakkaista näkökulmaa edustavien uutisten määrä väheni entisestään:

Konservatiivisen käyttäjän Facebookista algoritmi poisti viisi prosenttia niistä uutisista, joiden näkökulmaa voi pitää vastakkaisena heidän oman ideologiansa kanssa.

Samalla tavoin liberaalin käyttäjän Facebookista algoritmi leikkasi kahdeksan prosentin verran sisältöä, jota voi tulkita konservatiiviseksi.

Facebookin tutkijat tulkitsivat, että algoritmin merkitys oli vähäinen. Käyttäjät rajasivat itse omilla valinnoillaan uutisvirtansa pääasiallisen sisällön.

Toisaalta käyttäjän tekemän vapaan valinnan vertaaminen algoritmien tekemiin rajauksiin on harhaanjohtavaa. Kuinka suuri koneen vaikutuksen pitäisi olla, jotta sitä voisi pitää merkittävänä?

Yhdysvaltain presidentit valitaan tehtäviinsä niin pienin marginaalein, ettei viiden tai kahdeksan prosentin uutisleikkuria voi pitää merkityksettömänä.

Tutkimus keräsi jo tuoreeltaan ankaraa kritiikkiä (siirryt toiseen palveluun). Esimerkiksi tutkimuksen otos oli ongelmallinen, koska kohteena olivat vain ne käyttäjät, jotka omilla Facebook-sivuillaan määrittelivät itsensä joko konservatiivisiksi tai liberaaleiksi.

Pelastaako EU demokratian?

Toukokuussa voimaan astuva EU:n uusi tietosuoja-asetus edellyttää yritysten kertovan palveluidensa käyttäjille, miten tietoja kerätään – ja milloin käyttäjä on kohteena algoritmien avulla tehtävälle profiloinnille ja automaattiselle päätöksenteolle.

Asianajotoimisto Boreniuksen lakimies Peter Hännisen mukaan tietosuoja-asetus ei kuitenkaan vastaa algoritmien demokratiaan kohdistamaan uhkaan.

– Asetuksen ja ohjeistuksen perusteella välittyy velvollisuus kertoa algoritmien toiminnasta, mutta se velvollisuus on suppea ja toteutuu vielä suppeampana, Hänninen sanoo.

– Periaatteessa toimintalogiikkaa tulee avata, mutta käytännössä kyse on monimutkaisista algoritmeista ja usein esimerkiksi koneoppimisesta. Sitä on vaikea tiivistää muotoon, joka olisi käyttäjälle ymmärrettävä.

Tietosuoja-asetus? "Velvollisuus kertoa algoritmien toiminnasta on suppea ja toteutuu vielä suppeampana", Boreniuksen lakimies Peter Hänninen sanoo. Jouni Immonen / Yle

Verkkopalvelu saattaa kertoa käyttäjälle esimerkiksi, että ”keräämme paikkatietojasi, jotta voisimme tarjota sinulle sinua kiinnostavaa sisältöä”. Näitä sinänsä neutraaleja sijaintitietoja voidaan Hännisen mukaan käyttää myös demokratian kannalta vahingollisesti.

– Tarkoittaako paikkatietojen kerääminen esimerkiksi, että koska asun tietyllä asuinalueella, kuulun todennäköisesti tiettyyn sosioekonomiseen ryhmään, ja tästä syystä minulle suunnataan vain tietyn puolueen vaalimainontaa? Tai että minulle ei tästä syystä kohdenneta joitain uutissisältöjä?

Tietosuoja-asetuksen ensisijainen näkökulmana on Hännisen mukaan yksityisen kuluttajan suoja, ei laajempi yhteiskunnan etu tai demokraatinen prosessi.

Algoritmit viranomaisvalvontaan?

Suomen europarlaamentaarikoista Liisa Jaakonsaari (sd.) on pitänyt algoritmikysymystä esillä (siirryt toiseen palveluun). Hänen mukaansa ne ovat digiyhteiskunnan rakennuspalikoita, joista ihmisten on syytä olla perillä.

– Jos tämä koetaan vain tekniseksi kysymykseksi, nämä isot jätit voivat tehdä myös isoja polittisia päätöksiä, hän sanoo.

Jaakonsaari näyttää kuitenkin toistaiseksi luottavan kansalaisten valveutumiseen ja yritysten vapaaehtoisuuteen. Hän kertoo olevansa tyytyväinen siitä, että Googlen, Facebookin, Amazonin ja Microsoftin kaltaiset suuryhtiöt ovat oma-aloitteisesti (siirryt toiseen palveluun)ryhtyneet yhdessä pohtimaan tekoälyn ja algoritmien etiikkaa.

Jaakonsaari ei ota kantaa sihen, tulisiko yrityksiltä edellyttää avoimuutta lain voimalla.

Sellaisiakin vaatimuksia esitetään. Esimerkiksi internetin hallinnointiin perehtynyt Oxfordin yliopiston professori ja tietokirjailija Viktor Mayer-Schönberger esittää, että algoritmit otettaisiin samanlaiseen etukäteisvalvontaan kuin muutkin yhteiskunnan kannalta kriittiset toiminnot.

– Emmehän me itse testaa kaupoissa myytäviä elintarvikkeita, suorita autoille törmäyskokeita tai tee lääketestejä, hän toteaa ODMS Idustry Watch -blogissa (siirryt toiseen palveluun).

Kaikilla näillä aloilla on tiukka riskiarviointiin perustuva sääntely – ja viranomaiset toimintaa valvomassa. Jotain vastaavaa Mayer-Schönberger ehdottaa myös algoritmien valvontaan.

Boreniuksen tietosuojaan ja digitalisaatioon perehtynyt Peter Hänninen ei ole vakuuttunut, että erityislainsäädäntöä kannattaisi luoda alueella, joka kehittyy teknologisesti valtavan nopeasti.

Sitäkin vaihtoehtoa kannattaa hänen mukaansa kuitenkin arvioida.

– Joka tapauksessa olisi hyvä, että julkinen keskustelu lisääntyy, sillä tämä kannustaa yhtiöitä itse aktiivisemmin pohtimaan palveluidensa yhteiskunnallisia vaikutuksia.

"Aika hullu ajatus"

Yhdysvaltain presidentinvaalien jälkeen Facebook tyrmäsi väitteet, joiden mukaan sen välittämät valeuutiset olisivat vaikutttaneet vaalien lopputulokseen. Toimitusjohtaja Mark Zuckerbergin mukaan se oli “aika hullu ajatus” (siirryt toiseen palveluun).

Myöhemmin Facebook on myöntänyt, että jopa 126 miljoonaa yhdysvaltalaista sai palvelun kautta venäläisperäisiä valeuutisia. Valeuutiset kertoivat (siirryt toiseen palveluun) mm. että paavi suosii Donald Trumpia ja Hillary Clinton myi aseita ISIS-järjestölle.

Facebookin perustaja ja toimitusjohtaja Mark Zuckerberg Alberto Estevez / EPA

Facebookia tai sen perustajaa ei voi syyttää valeuutisten sisällöstä, mutta yhtiön algoritmi piti huolen, että merkittävä osa vastakkaisista näkökannoista ei koskaan päätynyt käyttäjien uutisvirtaan.

Tänään Facebook haluaa olla kunnon yrityskansalainen. Tammikuussa yhtiö kertoi (siirryt toiseen palveluun)yhtiön kääntävän algoritmiensa painopistettä ystävien ja perheen väliseen viestintään. Myöhemmin yhtiö kertoi painottavansa uutislähteitä, jotka käyttäjät kokevat luotettaviksi.

Toimitusjohtaja Mark Zuckerberg kertoi New York Timesin haastattelussa (siirryt toiseen palveluun)toivovansa, että perheen tyttäret Max ja August voisivat aikuisina ajatella isänsä saaneen aikaan hyvää.

– Haluamme varmistaa, että tuotteemme eivät ole vain hauskoja, vaan ne ovat hyväksi ihmisille, Zuckerberg sanoi ja lupasi säätää järjestelmiä.

Ulkopuoliset voivat vain toivoa parasta, kun tämä miljardööri virittää algoritmejaan.

Vastalääke kuplille

Väitöstilaisuuteen valmistautuva Kiran Garimella kutsuu Facebookin toimia pr-operaatioksi. Sosiaalisen median palveluiden tulisi kertoa, millaisia valintoja niiden algoritmit tekevät.

– Näillä asioilla on kuitenkin niin suuri yhteiskunnallinen merkitys, että hallitusten on syytä edellyttää niiltä jonkinlaista avoimuutta, Garimella sanoo.

Samaan aikaan hän epäilee, kuten Boreniuksen Hänninenkin, etteivät yritykset enää itsekään tiedä miten niiden algoritmit toimivat. Koneet seuraavat jokaista klikkaustamme ja oppivat koko ajan. Algoritmeja ei ole ohjelmoitu selittämään valintojaan.

– Tästä juuri on kyse, kun algoritmit ottavat vallan.

Hän asettaa toivonsa käyttäjiin. Jos ihmiset saavat tietää, etteivät he näe koko totuutta, kenties he ovat kiinnostuneita kuulemaan, mitä oman kuplan ulkopuolella tapahtuu.

Garimellan tutkimusryhmällä on jopa työkalu kehitteillä tätä tarkoitusta varten. Sekin on algoritmi, eräänlainen kuplautumisen vastalääke. Se tunnistaa polarisoituvat keskustelut, joissa osapuolet ovat jumiutumassa vastakkaisiin näkökulmiin, eikä keskusteluyhteyttä kohta ole.

– Algoritmimme yhdistää käyttäjät ihmisiin ja sisältöihin, jotka ovat oman kuplan ulkopuolella. Silloin on mahdollista oppia asioita, jotka ovat vastoin omia uskomuksia, hän sanoo.

Kuulostaa todelliselta rauhankoneelta – vaan kuka ottaisi algoritmin käyttöön? Facebook, Twitter, Google ja muut internetin jättiläiset virittävät koneistojaan viime kädessä liiketoiminnan tarpeiden mukaan.

– Tällainen algoritmi on yritysten kaupallisia intressejä vastaan. Klikkausten määrän maksimoinnin kannalta on parempi näyttää ihmisille asioita, jotka vahvistavat heidän olemassa olevia mielipiteitään, Kiran Garimella sanoo.

– Tämä on akateeminen projekti, mutta ainakin näytämme että tämä on mahdollista.

Korjaus 4/2018: Antti Järvinen toimii Googlen maajohtajana, aiemmin jutussa kerrottiin virheellisesti hänen jättäneen tehtävän.