Lukuaika noin 8 min

Moni nettipalvelu antaa käyttäjän ladata kopion omista tiedoistaan. Selviääkö niistä mitään?

Kuka minä olen?

Sitä tulee mietittyä harva se päivä. Periaatteessa voisin listata ammattini, perhesuhteeni, harrastukseni ja mieltymykseni ja väittää sen vastaavan kysymykseen.

Mutta se mitä ihminen itsestään luulee on vain puolet kuvasta. Loput on sitä, miltä näyttää muiden silmissä.

Kymmenen vuoden taakse ulottuva historiani sisältää 70 251 hakua ja 62 860 erillistä hakulausetta.

Joten turha arvuutella. Kysytään koneilta, jotka ovat tallentaneet tiedon jokaisesta tekemästäni hausta, julkaisemastani kuvasta ja kertomastani puujalkavitsistä.

Olen vuosien mittaan luovuttanut tarkoituksella ja vahingossa giga- ellen teratavuittain dataa mitä kummallisemmille yrityksille. Eniten sitä lienee päätynyt Googlelle, Facebookille ja Twitterille.

Koska nuo kolme haluavat olla hyviä yrityskansalaisia – tai ainakin vaikuttaa siltä – ne antavat käyttäjän ladata kopion omista tiedoistaan. Tosin itävaltalaisen Max Schremsin (wiki, profiili artikkelin lopussa) ansiosta tiedämme, että ainakin Facebookin tapauksessa kopio on kaukana kattavasta.

Tiedot pakettiin

Googlella on korskeasti nimetty Datan vapautusrintama, jonka tehtävänä on varmistaa, että käyttäjät saavat halutessaan ladattua kopion kaikista Googlelle luovuttamistaan tiedoista. Rintama löytyy nettisivulta dataliberation.blogspot.fi.

Vapautusrintaman blogi on päivittynyt viimeksi huhtikuussa 2013, mutta ei nyt huolestuta siitä. Kasaan Google Takeoutissa kaksi pakettia, joista isompaan tulee valokuvat, videot ja sähköpostit ja toiseen kaikki muu. takeout.google.com/settings/takeout

Pienempi paketti valmistuu varttitunnissa, mutta palvelu varoittaa, että multimediazippien valmistelussa ”voi kestää pitkään (tunteja tai mahdollisesti päiviä)”.

Siinä tosiaan menee kaksi päivää. Mitä tarkoittaa, että tällainen mitätön operaatio vaatii Googlen tapaiselta jättiläiseltä 48 tuntia? Yhtiöltä, joka kertoo reaaliajassa, mitä sen miljoonat ja taas miljoonat käyttäjät kysyvät hakukoneelta.

Jätän lopulta kuvat ja videot pois kokoelmista ja puran loput kiintolevylleni. 1 158 tiedostoa. Klikkaan hajamielisesti auki kartan paikoista, joissa Google tietää minun olleen.

Kartan tuijottaminen aiheuttaa huimausta. Ei siksi, että yhdysvaltalainen yritys tietää paikat joissa olen vieraillut, vaan siksi, etten pystyisi palauttamaan niitä mieleeni ilman tällaista apuvälinettä.

Samalla kun skrollailee ja zoomailee pisteestä toiseen, liukuu ajassa edestakaisin: ravintola Kööpenhaminassa viisi vuotta sitten, hotelli San Franciscossa vuotta myöhemmin, konferenssi Hämeenlinnassa tänä keväänä.

Historiassa on kummallisia aukkoja, sellaisia joiden puuttumista en ymmärrä. Miksei vierailu Göteborgissa kavereiden luona ole kirjautunut järjestelmään, kun samalta matkalta on kuitenkin toinen merkintä paria päivää myöhemmin? Enkö muka ole kertaakaan katsonut puhelimen Google-karttaa Sodankylän elokuvajuhlilla?

Onko kaikkitietävä Google voinut unohtaa jotain? Eikö se vain kerro kaikkea? Vai olenko ehkä kytkenyt gps:n pois päältä säästääkseni akkua enkä enää muista sitä?

Niin paljon tietoa, niin paljon kysymyksiä.

Häpeällinen hakuhistoria

Google-arkistoni äärellä käyn läpi kolmivaiheisen tunnereaktion.

Ensimmäinen vaihe on innostus – onpa paljon tietoa! Se varmaan kertoo minusta paljon. Esimerkiksi sähköposteja ehtii 18 vuodessa kertyä 338 151 kappaletta. Jos näitä lukemalla ei opi tuntemaan itseään, ei sitten mitenkään.

Toinen vaihe on ahdistus – onpa paljon tietoa. Se varmaan kertoo minusta liikaa. Hangouts-pikaviestien arkistossa on keskusteluja, jotka tahtoisin unohtaa. Muistutuksia siitä, millainen ääliö olen ollut ja mitä tyhmää olen tehnyt.

Sitten avaan hakuhistorian. Voi Jeesus, hakuhistoria. On vaikea keksiä paljastavampaa tietolähdettä – sieltä löytää tietämättömyydet, halut, aamuöiset huvituksen lähteet.

Kymmenen vuoden taakse ulottuva historia sisältää 70 251 hakua ja 62 860 erillistä hakulausetta. (Olen siis toistanut itseäni 7 391 kertaa.) En koskaan kerro kenellekään, mitä sieltä löytyy.

Tai no, jos nyt sen mainitsen, että yleisin hakulauseeni on ”fooo”, yhdeksän kertaa. Ja tuota, köh, yhtä monta kertaa olen googlannut oman nimeni. Lisäksi olen etsinyt metsäporno-termiä kerran lokakuussa 2012 ja toisen kerran tammikuussa 2015. En tiedä, miksi.

Kolmas ja viimeinen vaihe on ärsytys – miksei tietoa ole enemmän? Esimerkiksi My Activity -sivulta näkee Android-puhelimessa käynnistämäni sovellukset, mutta jostain syystä tietoja ei saa ladattua itselleen. myactivity.google.com

Eikä pelkistä hakulauseista ole kovin paljon iloa, jos ei saa tietää, mitä linkkejä on tulossivulla klikannut. Kyllähän Google senkin tietäisi, mutta ei kerro.

Facebook-tiedot ovat reikäisiä

Jatkan matkaa Facebookiin. Siinä missä Google tarjoili tiedot koneluettavassa muodossa (json, mbox, vcf, kmz), Facebookin näkemys omista tiedoista on karu html-sivu. Ilmeisesti yhtiön mielestä riittää, että saan edes jonkinlaisen käsityksen siitä, mitä olen sille vuosien mittaan kertonut.

Arkisto on reikäisempi kuin haulikolla ammuttu emmental-kimpale. Messenger-viestejä ei ole mukana lain, niiden tilalla vain anteeksipyyntö virheestä. Ystävälista on pelkkä nimiluettelo, josta ei edes näe, milloin suhde on alkanut.

Samalla tavalla puutteellinen on myös aikajana, jonka varhaisin tapahtuma on vuodelta 1987. Käsittääkseni Mark Zuckerberg oli silloin 3-vuotias, joten olen melko varma, että kyseinen asia on päätynyt timelinelleni vasta jälkikäteen.

Mikä törkeintä, poke- eli tökkäys-listassa on vain kolme nimeä. Kolme! Olen ihan varma, että kolme tökkäystä tuli vuonna 2008 täyteen päivässä. Missään ei kerrota, miten datadumppiin päätyneet tiedot on valittu tai mitä sieltä on jäänyt pois.

Twitter on yhtä masentava. Sen arkisto sisältää vain lähettämäni tweetit helposti silmäiltävään muotoon koottuna. Ei suosikkeja, ei uudelleentweettauksia, ei tietoa seuraajista tai seurattavista.

Toisin sanottuna siitä puuttuu kaikki sellainen tieto, mikä tekee Twitteristä kiinnostavan mainostajan kannalta. Asian todentamiseksi ei tarvitse kuin loikata mainostyökalujen puolelle.

Mainostajia ainakin kiinnostaa

Vaikka Twitter ei paljasta, kuinka se on minut profiloinut, se tarjoaa auliisti tietoa siitä, miten löytää mainoskampanjalle oikeat kohteet. ads.twitter.com

Ilmeisesti Suomi on vielä periferiaa, sillä toisin kuin vaikkapa Ruotsissa, täällä kampanjaa ei voi kohdistaa kaupungin tarkkuudella. Käyttäjän sukupuoli, kielitaito ja puhelimen käyttöjärjestelmä ovat kaikki Twitterin tiedossa – tietenkin.

Entäpä sitten kiinnostuksen kohteet? Tviittaajat jotka etsivät töitä, työskentelevät henkilöstöhallinnossa, lukevat dekkareita, ostavat hiustenhoitotuotteita, juovat olutta, ovat konservatiiveja tai liberaaleja, tykkäävät kissoista.

Tai käyttäytymiseen liittyvät kategoriat? Tviittaajat jotka syövät pikaruokaa, työttömät, raskaana olevat, ne jotka etsivät uutta asuntoa, ostavat valmistujaislahjoja tai Panasonicin tuotteita.

Pitäisi kai ilahtua siitä, että mainokset saa räätälöityä näin hienosti. Silti en mahda mitään sille, että reaktioni on lähempänä ällötystä: en ole koskaan kertonut näitä asioita Twitterille, mutta silti se tietää ne. Kuinka se on mahdollista?

Vastaus on kaksiosainen. Ensinnäkin tviiteistä on helppo poimia avainsanoja, mutta lisäksi Twitter tietää, ketä seuraat. Jos listallasi on lähinnä tv-kokkeja ja lumilautailijoita, lienee turvallista olettaa, että olet kiinnostunut ruuanlaitosta ja alppilajeista.

Mainostyökalut

Facebook on tässä suhteessa aavistuksen Twitteriä läpinäkyvämpi, sillä se kertoo hyvinkin innokkaasti, millä perusteella mainokset on valittu. Olen ilmeisesti tykännyt sivusta, joka liittyy viisauteen (Wisdom), joten nyt minulle näytetään siihen liittyviä mainoksia.

Totta, viisaus kiinnostaa. Ketäpä ei? Toinen hieno poiminta on urheilu ja hyvinvointi -otsikon alta löytyvä ”ihmisten pääkallot”, joka… äh, liian pitkä juttu kerrottavaksi tässä. (Kerron tarinan kysyttäessä Twitterissä: @osulop)

Lisäksi toimintani Facebookissa on saanut järjestelmän vakuuttuneeksi siitä, että Yhdysvaltain armeijan veteraanit ovat minulle relevantti mainosaihe. Tämä on siviilipalvelusmiehelle yllättävä tieto, mutta ainahan sota, rynkyt ja tankit kelpaavat.

Facebookin mainostyökalu sen sijaan tuntuu Twitteriä urkkivammalta. Osaltaan se johtuu profiilitiedoista, sillä niiden avulla Facebook-mainontaa voi kohdentaa erittäin tarkasti: ihmiset jotka juhlivat parisuhteen vuosipäivää kuukauden sisällä, kaukosuhteessa olevat, vastasyntyneiden lasten vanhemmat, lesket, Hotmail-käyttäjät, 4g-käyttäjät, parhaillaan matkalla olevat.

Toinen syy on mainosten maantieteellinen kohdentaminen. Haukkukaa vain vanhanaikaiseksi, mutta mielestäni on omituista, että Facebookissa voi naputella tekstikenttään katuosoitteen ja määrätä mainokset näkymään siellä asuville käyttäjille (ja 8 neliökilometrin alueelle sen ympärillä).

En tiedä. Kenties tämä on turhaa vainoharhaisuutta. Voihan suorajakeluna tulevia mainoksiakin lähettää vain tietylle postinumeroalueelle.

Elämä tiedostoissa

Suljen mainostyökalujen välilehdet ja palaan takaisin kiintolevylleni tallennettuihin tiedostoihin.

Niin kornilta kuin se tuntuukin, merkittävä osa elämästäni mahtuu näihin 15,8 gigatavuun. On erikoinen tunne tuijottaa tiedostolistaa ja yrittää visualisoida se, mitä kaikkea niihin sisältyy.

Jokaisen ihmisen pitäisi ainakin kerran ladata koneelleen kaikki se, mitä hänestä tiedetään. Se on hyödyllinen kokemus, mahdollisuus arvioida tekojaan ja tarvittaessa muuttaa toimintatapojaan netissä. Tämä minusta ainakin tiedetään, halusin sitä tai en.

Omien tietojeni tarkasteleminen oli voimaannuttavin teko sen jälkeen, kun salasin kovalevyni. Se synnytti orastavan hallinnan tunteen.

Sillä mitä tosiasioiden tunnustamisesta sanottiinkaan: ”Sinulle on asetettu tämä mainosaihe, koska pidit sivusta, joka liittyy aiheeseen Commodore 64.”

Profiili: Max Schrems

Kuva: Manfred Werner

Kuka Maximilian Schrems, itävaltalainen oikeustieteen opiskelija ja aktivisti.

Mitä Schremsin FB:tä vastaan Euroopan unionin tuomioistuimessa nostama kanne kaatoi ns. turvasatama- eli datasiirtosopimuksen EU:n ja USA:n välillä 2015.

Artikkeli julkaistu alun perin Mikrobitin numerossa 9/2016