Erikoinen otsikko viittaa tällä kertaa Esa Mäkisen dystopiaromaaniin Totuuskuutio (Otava, 2015), ja lienee suotavaa aloittaa pienellä kirja-arvostelulla.

Totuuskuutio kuvaa yhtä mahdollista maailmaa joskus vuoden 2050 tienoilla. Romaanin päähenkilö Tero Lilja työskentelee Internet-hakukonejätti ”Celciuksen” Suomen-konttorissa eräällä yrityksen vähemmän julkisuutta saaneella osastolla. Teron tehtävä on huolehtia siitä, että yrityksilläkin on oikeus tulla unohdetuksi Internetissä: jos netissä liikkuu maksavan asiakkaan kannalta epämieluisia uutisia, Tero ja hänen työtoverinsa korjaavat uutiset tai ainakin estävät niiden näkymisen suurelle yleisölle.

Tämä ei tietenkään ole sensuuria; se on ”täsmäyttämistä.”

En mene tässä kirjoituksessa enempää juonen yksityiskohtiin. Totean vain, että kirjassa on tavoiteltu Orwellin klassikoiden henkeä, ja paikoin siinä on myös onnistuttu. Kokonaisuutena kirja on oikein mainiota dystooppista fiktiota, ja varmasti lukemisen arvoinen kenelle hyvänsä spekulatiivisen fiktion ystävälle.

Erityisen kiinnostavan kirjasta tekee kuitenkin se, että siinä vuosisadan puolenvälin tienoille sijoitettu maailma olisi teknisesti mahdollinen jo nykyään. Käyttäytymistämme ja mielipiteitämme ohjaa jo nyt vahvasti se, millaisia uutisia esimerkiksi Facebookin salaiset algoritmit meille syötteeseemme tarjoavat. Vaikka algoritmeja ei peukaloitaisi tarkoitushakuisesti, kuten Tero Lilja ja hänen toverinsa kirjassa tekevät, niiden toiminta jo itsessään estää meitä näkemästä kenties merkityksellisiäkin uutisia. Facebook tarjoaa meille sellaisia viestejä ja linkkejä, jotka algoritmi arvioi meitä eniten kiinnostaviksi, ja Googlen harjoittama hakutulosten kustomointi aikaisemman selailuhistorian mukaan johtaa huomaamatta kuplaan, jossa vaihtoehtoisia näkemyksiä ei löydä edes etsimällä. Tämä ei voi olla vaikuttamatta mielipiteisiin.

Meille näkyvän informaation valikointi on jo sinänsä ongelmallista, ja informaatiokuplien eriytymistä pidetäänkin usein yhtenä syynä yhteiskunnallisen ilmapiirin kiristymiseen. Kuplia on käytetty tehokkaasti hyväksi syöttämällä niihin yksipuolista tai suorastaan valheellista informaatiota – valeuutisia. Kun riittävä määrä ihmisiä jakaa valeuutisen, on vähänlaisesti väliä sillä, onko itse uutinen totuudenmukainen vai ei: mielipiteisiin on jo ehditty vaikuttaa, ja totuudesta tulee vain yksi mielipide muiden joukossa.

Toistaiseksi on kuitenkin ollut ainakin periaatteessa mahdollista tarkistaa, pitävätkö valeuutiset paikkansa. Tiedonvälityksen luotettavuudesta huolestuneet tahot, Suomessa esimerkiksi Faktabaari, ovat tehneet parhaansa seuloakseen jyvät akanoista ja tarkistaakseen, ovatko kohutuimmissa uutisissa kerrotut asiat yhteneviä esimerkiksi arkistoitujen uutisten kanssa. Mutta entä jos tämä ei olisi mahdollista? Entä jos emme voisi luottaa digitaalisten arkistojen sisällön vastaavan todella sitä, mitä vaikkapa arkistoidussa lehtijutussa on joskus – kenties vuosia sitten – kirjoitettu?

Informaatiosodankäynnin varustelukilvassa on vain todennäköistä, että seuraava askel valeuutisisten saralla otetaan hyökkäämällä suoraan uutisarkistoja vastaan. Arkistojen peukaloinnilla voisi konkreettisesti muuttaa menneisyyttä, ja kuten Orwell aikanaan totesi, se joka hallitsee menneisyyttä, hallitsee tulevaisuutta. Uutisarkistot eivät todennäköisesti ole yhtä hyvin suojattuja kuin esimerkiksi pankkien tietoliikenne, ja tietomurtoa voisi olla vaikea edes huomata: ovela hyökkääjä voisi muutella arkistoja ja poistaa tietoja niin valikoiden, että hyökkäyksen havaitseminen vaatisi käytännössä yksityiskohtaista vertailua tunnettuun, luotettavaan aineistoon. Niin kauan kun esimerkiksi lehtien paperiarkistot ovat vielä olemassa, tämä on ainakin teoriassa mahdollista – joskin jotain sellaista, mikä jää käytännössä tavalliselta netinkäyttäjältä tekemättä. Mutta mitä tehdään sitten, kun kaikki arkistot ovat digitaalisia, ja arkisto ja sen varmuuskopio eroavat toisistaan? Miten todennetaan luotettavasti, mikä on peukaloitu ja mikä peukaloimaton versio?

Hyökkääjän tarkoituksiin voi riittää, että esimerkiksi uutisarkistojen luotettavuus joutuu kyseenalaiseksi. Tällöin vaikkapa menneisyyttään kaunistelemaan pyrkivä poliitikko voi väittää, että arkistomurron tarkoituksena oli syöttää arkistoihin hänet väärinkäytöksiin yhdistäviä valeuutisia. Väitteen todistaminen vääräksi voisi hyvin olla mahdotonta, ja kun arkiston luotettavuus on kerran joutunut vakavasti epäilyksen alaiseksi, sen luotettavuus voi olla ikuisesti mennyttä.

Arkistojen luotettavuuden varmistamisen ongelmasta on tulossa erityisen akuutti kahdesta syystä. Ensimmäinen syy on se, että ainakin tietomurroille vähemmän alttiiden paperiarkistojen aika alkaa olla ohi. Uutta materiaalia niihin ei enää juurikaan synny, kun koko yhteiskunnallinen elämämme on jo tietoverkoissa. Toinen syy on se, että kybersodankäynnin työkalujen kehittyminen voi antaa jo lähivuosina erittäin voimakkaita työkaluja kohdennettuun tietojen vääristelyyn. Tehokkaat algoritmit ja alkeelliset tekoälyt kykenevät jo nykyisin kirjoittamaan ymmärrettäviä uutisia; ne saattavat jo piakkoin kyetä vääristelemään arkistoituja uutisia puoli- tai jopa täysautomaattisesti, niin hyvin että väärennöksen toteaminen vaatii tarkkaavaisuutta.

Ongelmaan on pakko löytää ratkaisu, mieluiten ennen kuin ensimmäinen massiivinen historian vääristely pääsee tapahtumaan. Haaste on teoriassa suhteellisen yksinkertainen: on kehitettävä menetelmä, jolla voidaan taata digitaalisen historian aitous jälkikäteen. Olisi myös toivottavaa, jos käytetty menetelmä mahdollistaisi arkistojen hajauttamisen: näin arkiston luotettavuus ei olisi yhden ainoan toimijan varassa.

Ratkaisu: lohkoketjukronikka

Onneksi juuri tälläinen teknologia on nyt olemassa. Bittiraha Bitcoinin tarpeisiin alunperin keksitty lohkoketjutekniikka mahdollistaa luotettavien, hajautettujen tietokantojen rakentamisen. (Yksinkertaistettu esitys lohkoketjutekniikasta löytyy vaikkapa täältä.) Tarkoitusta varten laadittuun lohkoketjuun olisi teknisesti mahdollista tallentaa kokonaisia digitaalisia arkistoja tai niiden aitouden osoittavia tarkistussummia niin, että arkiston väärentäminen jälkikäteen olisi hyvin vaikeaa. Kun uutinen on tallennettu lohkoketjuun, sen aitoudesta voidaan periaatteessa olla varmoja niin kauan, kun maailmasta löytyy tietokoneita, jotka kykenevät kyseistä lohkoketjua lukemaan. Periaatteessa nyt olisi siis sekä mahdollista, että tarpeen, ryhtyä laatimaan arkistoa, jossa ihmiskunnan yhteinen digitaalinen muisti voisi säilyä vaikkapa sadan tuhannen vuoden ajan.

Käytännössä lohkoketjuarkisto voisi toimia esimerkiksi kansallisten arkistojen ja yliopistojen yhteistyönä pyörittämänä palveluna, johon tallennettaisiin säännöllisesti alueellisesti ja kielellisesti edustava otos uutisia ja muita ajankohtaisia aineistoja. Toisin kuin esimerkiksi Wikipediassa, arkiston tarkoitus ei olisi tallentaa narratiivisia tarinoita, vaan toimia primäärilähteiden arkistona – universaalina kronikkana. (Sana kronikka tarkoittaa aikakirjaa, johon historialliset tapahtumat kirjataan aikajärjestykseen. Kronikat ovat yksi tärkeimmistä lähdeaineistoista esimerkiksi keskiajan historiaa tutkittaessa.) Kustannussyistä kronikkaan ei edes pyrittäisi tallentamaan kaikkea Internetin sisältöä, ja samasta syystä alkuvaiheessa tallennettaisiin lähinnä raakateksti, mutta säilytystilan ja tiedonsiirtokapasiteetin halpenemisen ja/tai käytössä olevien resurssien kasvamisen myötä kronikka voisi laajentua kattamaan myös ”raskaampaa” aineistoa ja muutenkin laajentaa kattavuuttaan.

Jokaisella kronikkaa pyörittävällä ”noodilla” olisi tallennettuna koko kronikan sisältö, ja muutokset siihen vaatisivat esimerkiksi määräenemmistön hyväksynnän; näin kronikan muuttaminen tai tuhoaminen vaatisi koordinoitua hyökkäystä useisiin noodeihin yhtä aikaa. Kronikka siis eroaisi olemassaolevista Internet-arkistoista paitsi tässä suhteessa (esim. Internet Archive on vasta rakentamassa peilipalvelinta), myös siten, että tiedot pyrittäisiin tallentamaan kronikkaan pääosin pysyvästi. Tällä hetkellä suuri osa arkistoista noudattaa niinsanottua Oaklandin arkistointipolitiikkaa, jonka mukaan arkistoista on poistettava pyydettäessä esimerkiksi tiettyä henkilöä tai yritystä koskevat tiedot. Tämä on jo johtanut erikoisiin tilanteisiin, sillä esimerkiksi eniten käytetty nettiarkisto Internet Archive poistaa näkyvistä kaikki domain-nimen alasivut, jos päädomainin (esimerkiksi tällä blogilla jmkorhonen.fi) nykyinen haltija niin haluaa. Poistaminen tapahtuu automaattisesti, ja ratkaisevaa on vain se, kuka hallitsee päädomainia: vaikka materiaalin tuottanut aladomainin omistaja olisi nimenomaisesti toivonut sivujensa arkistointia, päädomainin haltijan niin pyytäessä myös aladomain-arkistot poistetaan näkyvistä.

Keskeinen syy tälläiselle, digitaalisen historian väärentämistä suorastaan kutsuvalle politiikalle on oikeusjuttujen pelko. Arkistojen keräämistä säännellään varsin tarkasti mm. henkilörekisterilailla, ja esimerkiksi kunniaa loukkaavan materiaalin päätyminen arkistoon kaikkien nähtäväksi altistaa myös arkiston ylläpitäjän syytteelle kunniaa loukkaavan materiaalin levittämisestä. Kronikassa ongelma voitaisiin ratkaista useammalla eri tavalla tai niiden yhdistelmillä. Yksi tärkeä lähtökohta olisi kronikan ylläpitäjien (noodien) rajoittaminen kansallisiin arkistoihin ja muihin viranomaisiin rinnastettaviin tahoihin, joilla on jo nyt mahdollisuus ja jopa velvoite kerätä digitaalisiakin arkistoja, sekä säädellä tarvittaessa pääsyä arkistoihin niin, että arkaluonteinen materiaali ei pääse julkiseen levitykseen. Toinen, selvästi virheellisten tietojen kronikointia ehkäisevä sääntö voisi olla tietojen tallentaminen viiveellä esimerkiksi uutisten julkaisusta. Näin selvästi virheelliset uutiset ehdittäisiin todennäköisesti korjata ennen kuin ne tallentuvat kronikkaan.

Kronikkaan tallennettava tieto tai osa siitä voitaisiin myös lähtökohtaisesti salata tietyksi ns. embargo-ajaksi. Teknisesti olisi mahdollista salata arkistomateriaali esimerkiksi niin, että salatut tiedot voidaan avata vain, jos enemmistö noodeista äänestää avaamisen puolesta. Avaaminen voitaisiin hoitaa rutiininomaisesti sovitun ajan kuluttua, tai se voitaisiin tehdä erikoistapauksissa enemmistöpäätöksellä aikaisemmin, mikäli olisi syytä epäillä esimerkiksi avoimiin arkistoihin kohdistunutta väärennöstapausta. Epäilysten todentamiseksi kronikkaan tallennettaisiin jokaista sinne tallennettua tiedostoa kohden myös niinsanottu tarkistussumma. Vertaamalla kronikkaan tallennettua tarkistussummaa avoimessa arkistossa (esimerkiksi sanomalehden omassa arkistossa) säilytetystä tiedostosta samalla kaavalla laskettuun tarkistussummaan on mahdollista tarkastaa, vastaako avoimen arkiston tiedosto edelleen kronikkaan tallennettua vastinettaan. Jos tarkistussummat eivät täsmää ja peukalointia on syytä epäillä, prosessi kronikkaan salatun tiedoston avaamiseksi voitaisiin tarvittaessa aloittaa. Tarkistussumma voi myöskin olla avoin kaikkien luettavaksi, sillä se ei paljasta mitään itse tiedoston sisällöstä, eikä siten voi loukata esim. henkilötietolakia tai johtaa syytteisiin kunnianloukkauksesta – joskin ratkaistavaksi jää vielä ongelma, miten mahdollisesti muuttuvat nettiosoitteet ja muut vastaavat ongelmat huomioidaan.

Epävirallisten tiedustelujeni ja esimerkiksi Museoviraston henkilökunnan kanssa käymieni keskustelujen perusteella uskon, että yllä ja tässä englanninkielisessä esityksessä kuvattu kronikka olisi paitsi kipeästi tarpeen, myös teknisesti täysin mahdollinen toteuttaa. Eräs Suomen johtavista lohkoketjuasiantuntijoista arvioi alustavasti järjestelmän kehittämisen kustannusarvion olevan noin viisi miljoonaa euroa. Tämä on varsin pieni raha potentiaalisesti sadan tuhannen vuoden arkistosta. Olemmekin nyt edistämässä kronikkaa lohkoketjun mahdollisuuksia tutkivassa ReCon-tutkimushankkeessa, jossa nykyisin työskentelen. Jos olet kiinnostunut kronikan mahdollisuuksista tai sen toteuttamisesta tai haluat kuulla lisää ReCon-hankkeesta, ota yhteyttä – sähköpostilla minut saa kiinni esimerkiksi osoitteesta blockchain.janne@gmail.com.