Venäläisen hakukoneen Yandexin kasvojentunnistusalgoritmi on pelottavan hyvä. Se herättää vakavia kysymyksiä yksityisyydensuojasta.

Valheenpaljastaja neuvoi hiljattain, miten käänteisen kuvahaun ja muutamien muiden helppokäyttöisten työkalujen avulla voi jäljittää kuvien alkuperää verkossa. Näin kuka tahansa voi esimerkiksi selvittää, esittääkö jokin sosiaalisessa mediassa leviävä kuva sitä, mitä sen väitetään esittävän.

Yksi näistä käänteisen kuvahaun palveluista on ylitse muiden. Venäläinen Yandex palauttaa huomattavasti parempia osumia kuin esimerkiksi Googlen kuvahaku.

Yandexin kuvahaku on melkeinpä pelottavan hyvä. Sen erityinen supervoima on kasvojentunnistus.

Samannäköisissä kuvissa tulee yllätys: neljä ensimmäistä tulosta tosiaan esittävät minua.

Katsotaanpa esimerkin avulla, millaisia tuloksia Yandexin ja Googlen kuvahaut antavat.

Kokeilen etsiä omia kasvojani. Lataan kuvahakuihin itsestäni kuvan, jota ei ole ennestään internetissä. Rajaan puolivartalokuvasta pelkät kasvot ja syötän rajatun kuvan ensin Google Imagesiin. Google tekee kuvasta suhteellisen yllättävän arvauksen "girl”, eli hakukone arvelee kuvan esittävän tyttöä.

Googlen samannäköiseksi määrittelemät kuvat esittävät vaaleahiuksisia naisia. Heillä ei edes ole silmälaseja, toisin kuin minulla.

Googlen kuvahaun tuloksia. Kuvahaun tulos, naisen kasvokuvia Kuva: Yle / Johanna Vehkoo

Yandex toteaa Googlen tapaan, että juuri tätä kuvaa ei löydy verkosta. Samannäköisissä kuvissa tulee yllätys: neljä ensimmäistä tulosta tosiaan esittävät minua. Kuvista yksi on pysäytyskuva videosta, muut ammattikuvaajien otoksia, joita löytyy useilta verkkosivustoilta. Minulla on kuvissa yhteensä kolmet eri silmälasit, toki kaikki samantyyppisiä mustasankaisia. Silmälasien vaihtaminen ei todennäköisesti huijaisi Yandexia.

Yandexin algoritmi on kiistatta osannut etsiä juuri minun kasvojani, vaikka loput osumat ovatkin muita silmälasipäisiä vaaleita naisia.

Yandexin kuvahaun tuloksia. Kuvahaun tulos, naisen kasvokuvia Kuva: Yle / Johanna Vehkoo

Tiivistäen: kun Googlesta tekee kuvahaun vaikkapa parrakkaan miehen kuvalla, saa tulokseksi kokoelman parrakkaita miehiä. Kuvien värimaailma näyttää suhteellisen samalta, mutta parrakkaat miehet voivat olla hyvinkin erinäköisiä. Kun saman haun tekee Yandexilla, se etsii juuri kyseisen parrakkaan miehen kuvia. Kuvien taustaan se ei kiinnitä juurikaan huomiota.

Kasvojentunnistuksen siirtyminen kaikkien saatavilla oleviin hakupalveluihin ja puhelinsovelluksiin herättää hankalia kysymyksiä yksityisyydensuojasta. Teknologian väärinkäyttö on rikollisille houkuttelevaa. On helppo kuvitella monenlaisia tapauksia, joissa pahantahtoiset ihmiset voivat käyttää kasvojentunnistusta hyödykseen. Stalkkaaminen, vainoaminen ja kiristys tulevat hakematta mieleen.

Esimerkiksi mielenosoituksen osanottajia on helppo tunnistaa valokuvista Yandexin kuvahaun avulla. (Yandexin hakutulokset ovat tosin Itä-Eurooppaan painottuneita.)

– Teknologia ei sinänsä ole hyvä eikä paha, vaan olennaista on se, mihin sitä käytetään, sanoo tietoturvayhtiö F-Securen tekoälyjohtaja Matti Aksela.

– Massaseuranta on tietenkin huono asia. Siksi esimerkiksi EU:ssa pitää keskustella, miten ohjata toimia siihen suuntaan, ettei teknologiaa käytetä väärin.

Euroopan komissio suunnittelee parhaillaan lainsäädäntöä, joka antaisi kansalaisille oikeudet omaan kasvojentunnistusdataansa.

Moni muukin yhtiö luultavasti pystyy samaan

Google on mitä ilmeisimmin päättänyt olla toistaiseksi olla ottamatta kasvojentunnistusta käyttöön kaikille avoimessa hakupalvelussaan. On varsin todennäköistä, että myös Google pystyisi vastaavaan kuin Yandex. Se on maailman ylivoimaisesti käytetyin hakukone ja sillä on kaikki mahdollisuudet kehittää johtavaa teknologiaa. Esimerkiksi neuroverkkoja hyödyntävä Google Deep Mind kuuluu tekoälykehityksen edelläkävijöihin.

Googlen entinen toimitusjohtaja Eric Schmidt varoitti kasvojentunnistusteknologian vaaroista jo vuonna 2011. Hän totesi sen olevan "liian kammottavaa” Googlelle.

Kasvojentunnistus on kehittynyt viime vuosina hurjaa vauhtia. Osittain syynä on datan saatavuuden parantuminen, osittain tietokoneiden laskentatehon kasvu. Myös menetelmät ovat kehittyneet huomattavasti.

– Verkosta löytyy paljon sekä luvallista että luvatonta kuvamateriaalia, joka on mallien opetuksen kannalta erittäin arvokasta. Kuvantunnistus kiinnostaa monia toimijoita, koska se on koneoppimisen ja syvien neuroverkkojen kannalta loistava esimerkkikäyttötapaus, sanoo Matti Aksela.

On helppo kuvitella monenlaisia tapauksia, joissa pahantahtoiset ihmiset voivat käyttää kasvojentunnistusta hyödykseen.

Yksinkertaistaen kasvojentunnistus toimii siten, että algoritmia koulutetaan tunnistamaan erilaiset kasvonpiirteet. Tätä varten täytyy olla tarpeeksi paljon tarpeeksi hyvää dataa, jotta järjestelmä oppii erottamaan eri ihmisten kasvot toisistaan.

– Kuvantunnistuksessa käytettävät algoritmit eivät ajattele ihmismäisesti, vaan ne perustuvat kuvista laskettujen piirteiden vertaamiseen. Ne vertaavat pikselijoukkoja toisiinsa, Aksela sanoo.

Me olemme itse tuottaneet tämän datan verkkoon. Akselan mielestä kaikkien verkonkäyttäjien olisi olennaista ymmärtää, ettei omia kuvia saa enää takaisin, kun ne on ladannut verkkoon ja tägännyt jonkun ihmisen nimellä.

Naisia jäljitettiin sovelluksen avulla Venäjällä

Venäläisfirmat ovat olleet kasvojentunnistuksen edelläkävijöitä jo pitkään, ja niiden tuotteita on käytetty muun muassa doxaukseen eli henkilötietojen luvattomaan julkaisemiseen ja levittämiseen.

Erään venäläisen verkkoyhteisön jäsenet päättivät käyttää Find Face -nimistä sovellusta pornoelokuvissa esiintyneiden naisten jäljittämiseen. He etsivät naisten kuvia ja yhdistivät kuvat henkilötietoihin. Sitten doxaajat ilmoittivat naisten läheisille näiden toimineen pornonäyttelijöinä. He tekivät samaa myös prostituoiduille.

Venäläinen kasvojentunnistussovellus Find Face muutti ensin nimensä Search Faceksi, ja nykyään sovellus on nimeltään Find Clone. Sen omistajat eivät ole tiedossa. Sovelluksen tietokanta on kerätty "Venäjän Facebookiin" VKontakteen ladatuista kuvista.

"Se on yksi pelottavimmista, voimakkaimmista työkaluista, joita olen käyttänyt verkossa", kirjoittaa tutkivan journalismin ryhmän Bellingcatin tutkija Aric Toler.

Kasvojentunnistus valtion ja viranomaisten käytössä

Tammikuussa New York Times kirjoitti suurelle yleisölle tuntemattomasta startupista nimeltä Clearview AI. Firman puhelinsovelluksen avulla voi ottaa kuvan henkilöstä ja etsiä saman henkilön kasvoja yli kolmen miljardin kasvokuvan tietokannasta, jonka yritys on kerännyt Facebookista, Youtubesta ja muilta verkkosivustoilta.

Yhdysvalloissa jopa sadat poliisilaitokset ovat käyttäneet Clearview AI:n kasvojentunnistusta muun muassa näpistelyjen, identiteettivarkauksien, luottokorttihuijausten ja väkivaltarikosten selvittämiseen. New York Timesin mukaan viranomaisilla ei ole mitään keinoa valvoa, miten yritys käsittelee sovellukseen syötettyä dataa.

Monet Yhdysvaltain kaupungit, esimerkiksi San Francisco, ovat toisaalta jo kieltäneet kasvojentunnistuksen käytön.

Kiinassa valtio on hyvän aikaa käyttänyt kasvojentunnistusta uiguurivähemmistön tarkkailuun ja valvontaan. Kyseessä on ensimmäinen tunnettu tapaus, jossa valtion on osoitettu käyttävän tekoälyä etniseen profilointiin. Kiinalaisessa systeemissä valvontakameroita on yhdistetty kasvojentunnistusjärjestelmään, joka kiinnittää huomiota ulkoisesti uiguureilta vaikuttaviin henkilöihin.

Joitakin kasvojentunnistusjärjestelmiä on taas kritisoitu siitä, että ne tunnistavat paremmin valkoiset kasvot kuin tummaihoiset. Esimerkiksi Amazonin Rekognition todistetusti tunnistaa naisten kasvoja huonommin kuin miesten, ja se myös erehtyy usein väittämään tummaihoisia naisia miehiksi. Väärät tunnistukset luovat tilanteita, joissa ihmistä voidaan syyttää jostakin, mitä hän ei ole tehnyt.

Uskaltaako sitä käyttää älypuhelimessa?

Useimmille kasvojentunnistus on tuttu yhdestä arkipäiväiseksi muodostuneesta asiasta: älypuhelimen lukituksesta. Lukuisissa uusissa puhelinmalleissa puhelimen voi pin-koodin lisäksi avata joko sormenjälki- tai kasvojentunnistuksella.

Voiko kuluttaja käyttää tätä lukitustapaa turvallisesti vai onko vaarana, että puhelimen tallentama kasvodata leviää ties minne?

– Tietoturva-asioissa pitäisi aina tehdä uhkaskenaarioiden arviointi, sanoo F-Securen Aksela.

– Ihminen on usein itse se heikoin lenkki. Puhelimella olevan datan suojaamisen kannalta on paljon parempi laittaa puhelimeen kasvojentunnistuksella toimiva lukitus kuin ei mitään suojausta, tai vaikka pin-koodi 1234.

Se, voiko kuluttaja luottaa, ettei puhelin jaa kasvodataa eteenpäin, on monimutkaisempi kysymys.

– Aina kannattaa miettiä, mihin yrityksiin voi luottaa ja kuinka paljon.

Valheenpaljastaja käsittelee faktaa ja fiktiota uutisissa ja sosiaalisessa mediassa. Lähetä juttuvinkki: valheenpaljastaja@gmail.com.