Viime kesänä tiedejulkaisu Nature (siirryt toiseen palveluun) kertoi tietokoneohjelman pystyvän ennustamaan kemikaalien myrkyllisyyden eläinkokeita tarkemmin. Yhdysvaltalaisen Johns Hopkinsin yliopiston professorin Thomas Hartungin tutkimuksen mukaan koneoppimisen avulla koulutettu algoritmi kykeni tarkasti ennustamaan kymmenien tuhansien kemikaalien myrkyllisyyden.

Tekoäly on korvaamassa eläinkokeet, otsikoi nettijulkaisu Quartz (siirryt toiseen palveluun). Saman suuntaisen ennustuksen esitti myös itse Hartung The Conversation -tiedesivustolla (siirryt toiseen palveluun) julkaistussa kirjoituksessaan. Tutkija arvioi, että kemikaalien myrkyllisyystietoja ristiinlukevan algoritmin avulla voitaisiin säästää yli kaksi miljoonaa eläintä vuodessa.

Kaksi miljoonaa eläintä on paljon, mutta aivan eläinkokeiden lopettamiseen määrä ei riitä. Pelkästään Euroopan unionissa tehdään vuosittain kokeita yli 10 miljoonalla eläimellä. Toksisuuteen ja muihin turvallisuusarviointeihin – eli juuri niihin tutkimuksiin, joihin Hartung algoritmiaan sovelsi – käytettävien eläinten määrä on noin miljoona.

Eikä tätä määrää niin vain vähennetä, ainakaan ilman uusia eläinkokeita.

Maailman kattavin tietopankki kemikaaleista sijaitsee Helsingissä

Hartungin tutkimusryhmä rakensi koneoppimismallinsa Euroopan kemikaaliviraston kokoaman datan avulla. EU on yli kymmenen vuoden ajan vaatinut kemikaalien valmistajia ja maahantuojia rekisteröimään tiedot kaikista kemikaaleista, joita valmistetaan tai myydään yli tonnin verran EU-alueella vuodessa.

REACH-lainsäädännön ansiosta Euroopan kemikaalivirastolle on kertynyt maailman kattavin tietopankki eri kemikaaleista. Muista vastaavista lainsäädännöistä poiketen REACH-hanke velvoittaa kemianteollisuuden arvioimaan myös kemikaalit, jotka ovat olleet markkinoilla ennen lainsäädännön voimaan astumista.

Tämän ansiosta kemikaaliviraston arkistosta löytyvät tiedot yli 120 000 kemikaalista. Mitä yleisempi kemikaali, sitä enemmän tietoa on. Muutamista kiloista koostuvien kemikaalimäärien kohdalla tiedossa saattaa olla vain nimi ja luokitus. Yli sadan tonnin kemikaaleista tiedetään kaikki mitä aineesta on selville saatu, usein eläinkokeilla.

Koneoppiminen on auttanut valtavasti jo nyt, mutta eläinkokeiden lopettaminen vaatisi valtavan määrän tietoa, jota saadaan eläinkokeilla, Mike Rasenberg

Tämän valtavan aineiston Hartungin tutkijaryhmä kopioi EU:n kemikaaliviraston tietojärjestelmästä. Data ei ollut koneelle ymmärrettävässä muodossa, joten ryhmä loi siitä oman tietokannan.

Hartung aikoi julkaista muokkaamansa aineiston vapaaseen käyttöön, jolloin kemikaalivirasto puuttui asiaan. Virasto huomautti, että aineiston tulokset kuuluvat yrityksille, jotka olivat tehneet testit. Lopulta Hartung suostui jättämään aineistonsa julkaisematta.

Kemikaalivirastossa ei muutenkaan oltu innoissaan Hartungin ryhmän tutkimuksesta. Viraston tutkijat huomauttivat, että monen kemikaalin tiedot eivät olleet tarpeeksi kattavat luotettavan koneoppimismallin luomiseen.

Eläinkokeiden korvaaminen algoritmeilla ei ole mahdotonta, mutta niin yksinkertaista kuin Hartung antaa ymmärtää se ei ole, toteaa kemikaaliviraston laskennallisen arvioinnin yksikönpäällikkö Mike Rasenberg.

Kemikaaliviraston laskennallisen arvioinnin päällikkö Mike Rasenberg ei usko algoritmien korvaavan eläinkokeita lähitulevaisuudessa. Mårten Lampén / Yle

Perinnölliset vaikutukset yhä liian kova pala koneelle

Euroopan kemikaalivirasto tarjoaa valtioille ja yrityksille omaa työkaluaan (siirryt toiseen palveluun) kemikaalien myrkyllisyyksien selvittämiseen ja ennustamiseen. Sovelluksen avulla kuka tahansa voi tarkastella kemikaalitietoja tai kartoittaa uusien kemikaalien riskejä ristiinluennan avulla.

Jos esimerkiksi kemianteollisuuden yritys aikoo tuoda markkinoille uuden kemikaalin, se voi työkalun avulla selvittää tuotteensa yhteneväisyyksiä jo markkinoilla oleviin kemikaaleihin. Lopulta kemikaalivirasto päättää, hyväksyykö se selvityksen tieteelliset perusteet vai vaatiiko uusi kemikaali eläinkokeita.

Se miten hyvin kemikaaliviraston työkalu onnistuu ennustamaan kemikaalin riskit, riippuu sekä datan määrästä että selvitettävästä riskistä. Mitä enemmän tietoa on ja mitä yksinkertaisemmasta vaikutuksesta on kyse, sitä paremmin malli toimii.

– Esimerkiksi ongelmia iholla aiheuttavat kemikaalit ovat tällaisia. Seuraus on suhteellisen helppo ymmärtää ja sen suhteen voidaan tehdä melko luotettavia ennusteita, Rasenberg kuvailee.

Sen sijaan esimerkiksi syöpää tai perinnöllisiä sairauksia aiheuttavien kemikaalien suhteen algoritmit eivät vielä toimi. Dataa ei ole tarpeeksi, eivätkä vaikutukset ole yksinkertaisia.

Tällaisia riskejä selvitettäessä algoritmia voidaan käyttää kompassina. Sen avulla voidaan ennustaa, mikä kemikaali saattaa aiheuttaa tai saattaa olla aiheuttamatta ongelmia. Lopullinen varmuus saataisiin kuitenkin vasta eläinkokeilla.

Voivatko algoritmit kuitenkin joskus lopettaa eläinkokeet?

– Koneoppiminen on auttanut valtavasti jo nyt, mutta eläinkokeiden lopettaminen vaatisi valtavan määrän tietoa, jota saadaan eläinkokeilla. Ehkä sadan vuoden päästä, mutta ei lähitulevaisuudessa, Rasenberg pohtii.

Tulevaisuudessa voimme kaikki olla koe-eläimiä

Eläinkokeet eivät kuitenkaan ole ainoa keino tuottaa dataa kemikaalien riskeistä. Tampereen Hervannassa sijaitsevassa monikudosmallintamisen huippuyksikössä tietoa kerätään maljalla kasvavista ihmissoluista.

Monikudosmallintamisen avulla tutkijat kykenevät mallintamaan ihmiskehon eri kudosten reaktioita eri aineisiin tai sairauksiin. Tampereella on keskitytty mallintamaan sairauksia.

– Me voimme mallintaa esimerkiksi rasva-aineenvaihdunnan merkitystä muiden kehon solujen toimintaan. Tai voimme kiusata hermosoluja sähköllä ja nähdä, miten hermosolut siihen reagoivat ja sen jälkeen tarkkailla, miten muut solut reagoivat, kertoo tutkimusyksikön johtaja professori Minna Kellomäki.

Eläinkokeisiin verrattuna monikudosmallintaminen antaa huomattavasti tarkempia tuloksia. Kun tarkastelussa ovat yksittäiset solut tai soluryhmät, reaktiot nähdään selvästi.

Yksi eläinkokeiden ongelma – eettisten kysymysten lisäksi – on yksilöllisyys. Kuten ihmisetkin, eläimet ovat yksilöitä ja aina testitulokset eivät ole yhteneväisiä saman kemikaalin osalta. Monikudosmallintamisessa tästä ongelmasta tulee etu.

– Me toivomme, että tulevaisuudessa voisimme ottaa juuri tietyn henkilön soluja ja hyödyntää niitä mallin tekemisessä ja sen avulla katsoa, miten juuri hänen solunsa reagoivat johonkin asiaan, Kellokangas kaavailee.

Tulevaisuudessa jokainen meistä siis saattaa olla oman elämänsä koe-eläin.

Uutisen kommentointimahdollisuus on avoinna klo 22 asti. Tervetuloa mukaan.