Tekoäly ja lainsäädäntö – EU tarttuu tekoälyä sarvista
AI Act eli uusi Euroopan unionin tekoälyasetus etenee. Teoston laki- ja kansainvälisten asioiden johtaja Antti Härmänmaa tarjoaa näkökulmassaan tiiviin katsauksen tekoälyn sääntelyn tilanteeseen tekijänoikeuden näkökulmasta.
Tekoäly ja lainsäädäntö puhuttavat juuri nyt, ja tekoälyn kehitysvauhti on kuluvan vuoden ajan ollut huimaavaa. Uusia, toinen toistaan vaikuttavampia sovelluksia julkaistaan lähes kuukausittain. Välillä tuntuu, että kehityksen nopeudelle vetää vertoja korkeintaan tahti, jolla erilaisia tekoälyä koskevia kirjoituksia julkaistaan maailmaan. Näin merkittävä ilmiö luonnollisesti puhuttaa.
Tekoälyä hyödyntävät sovellukset asettavat uusia kysymyksiä tekijänoikeudelle. Kysymykset askarruttavat syystäkin tekijänoikeuden parissa työskenteleviä.
Kieltämättä kaikista ajankuvaamme värittävistä mullistuksista huolimatta on vaikea nähdä, mikä muu kuin tekoäly voisi samassa mittakaavassa mullistaa luovan työn tekemisen tapoja ja luoda siihen uusia mahdollisuuksia. Tai siltä ainakin juuri tällä hetkellä vaikuttaa. Ensi vuonna maailma saattaa näyttää taas kovin toisenlaiselta.
EU pyrkii sääntelemään villiä länttä
Koska teknologisen kehityksen vauhti on ollut niin huikea, ei ole yllättävää, että lainsäädäntö ei ole pysynyt vauhdissa mukana. EU:n tekoälyasetus onkin ollut jo vuosia valmisteilla. Tällä välin käytännön tasolla eli siinä, mihin tekoäly pystyy ja mihin ja miten sitä hyödynnetään, on ehditty ottaa melkoisia harppauksia. Sovellukset kuten ChatGPT ja Midjourney tuottavat parhaimmillaan uskomatonta sisältöä.
Huimien mahdollisuuksien ohella tekoälyyn liittyy myös merkittäviä uhkakuvia. En kertaa kaikkia konkreettisia ja mielikuvituksellisia dystopioita, mutta on selvää, että tekoälyn luomia valtavia kyvykkyyksiä voidaan käyttää rakentaviin ja vähemmän rakentaviin tarkoituksiin. Hallitsematon teknologinen disruptio aiheuttaa hallitsemattomia ulkoisvaikutuksia. Pelisääntöjä siis kaivataan kipeästi. Kehitys on ollut niin nopeaa, että sääntöjä ei juuri tällä hetkellä ole.
Tekoäly ilmiönä on kuitenkin vaikeasti säänneltävä. Sääntelyn näkökulmasta haasteita liittyy etenkin siihen, että ilmiön vaikutukset läpäisevät koko yhteiskunnan.
Sen lisäksi, että ilmiö on laaja, se on myös nopeasti muotoaan muuttava. Nyt jos koska sääntelijän on osuttava vertauskuvalliseen liikkuvaan maaliin. Haasteita aiheuttaa myös käsitteiden määrittelemisen vaikeus: mitä tekoäly itseasiassa on? Kuten Ylen kesäkuisessa artikkelissa kerrotaan, tekoälyä on kaikki mikä ei vielä toimi. Kun se toimii, niin siitä muodostuu sovellus tai ohjelmisto. Onkin esitetty, että ilmiötä tulisi säännellä pala kerrallaan, sektorikohtaisesti, ehdotetun horisontaalisen yleissääntelyn sijaan.
Tekoäly ja lainsäädäntö: missä asetus tällä hetkellä menee?
Kaikista haasteista huolimatta asetus nytkähti kesäkuussa eteenpäin, kun Euroopan parlamentti äänesti omasta tekoälyasetusta koskevasta tekstistään. Seuraavaksi tekoälyasetus etenee komission, neuvoston ja parlamentin välisiin kolmikantaneuvotteluihin, jossa asetus saa lopullisen muotonsa. Valmista on odotettavissa mahdollisesti loppuvuodesta, viimeistään vuoden 2024 alussa.
Kun asetus aikanaan astuu voimaan, se on jäsenvaltioissa suoraan sovellettavaa lainsäädäntöä, eikä se direktiivistä poiketen edellytä erillistä kansallista voimaansaattamista. Asetuksen yhteydessä ollaan kuitenkin säätämässä myös erillistä direktiiviä tekoälyyn liittyvistä vastuukysymyksistä (Artificial Intelligence Liability Directive, AILD). Tämän direktiivin osalta ollaan kuitenkin vielä kauempana valmiista kuin asetuksen kohdalla. Aikataulusta on vielä tässä vaiheessa vaikea sanoa.
Oikeudenhaltijoiden näkökulmasta asetusluonnokseen tehtiin parlamentissa muutama tärkeä muutos, joista kerron tarkemmin tekstin lopussa. Sitä ennen on kuitenkin sanottava sananen tekoälyyn liittyvistä tekijänoikeudellisista kysymyksistä.
Tekoäly ja tekijänoikeus: kaksi keskeistä kysymystä
Tekijänoikeudellisessa tekoälykeskustelussa on esiintynyt kaksi pääteemaa.
- Tekoälyn luomien tulosten mahdolliset oikeudet. Nauttivatko tekoälyn tulokset tekijänoikeuden tai jonkun muun immateriaalioikeuden suojaa?
- Mitä tekijänoikeudellisesti tapahtuu, kun tekoälysovelluksen taustalla olevaa neuroverkkoa koulutetaan?
Näistä tekoälyasetuksen kannalta päivänpolttavampi kysymys on jälkimmäinen. Keskustelua ovat osaltaan vauhdittaneet viimeaikaiset oikeudenkäynnit, joista kenties eniten julkisuutta on saanut Getty Images -kuvatoimiston nostama oikeusjuttu Stability AI -yhtiötä vastaan tekijänoikeuksiensa ja tavaramerkkiensä loukkaamisesta. Stability AI oli kehittänyt Stable Diffusion -nimisen kuvia generoivan tekoälysovelluksen. Sovelluksen koulutusmateriaaliin oli mitä ilmeisimmin sisältynyt myös Gettyn kuvia, koska tekoäly tuotti kuvia, joihin toistui myös vääristynyt versio Gettyn vesileimasta.
Tekoälyä opetetaan teoksilla: Snoop Doggin tuomarinohjeet
Luovia sisältöjä, kuten tekstiä, kuvia tai musiikkia tuottavien tekoälysovellusten taustalla olevaa neuroverkkoa koulutetaan olemassa olevilla teoksilla. Näin sovellus oppii mallintamaan koulutusaineistoaan, ja ”tuottamaan” sisältöä sovelluksen käyttäjän antamien ohjeiden perusteella.
Konkreettisenä esimerkkinä pyysin ChatGPT-sovellusta kirjoittamaan Olaus Petrin 1500-luvulta peräisin olevat tuomarinohjeiksi kutsutut juristin eettiset ohjeet, mutta siten kuin Snoop Dogg olisi ne kirjoittanut:
”Aight, listen up y’all, it’s your boy Snoop Dogg,
Talkin’ ’bout Olaus Petri and his guidelines for the law.
This dude was a Swedish judge back in the day,
And he had some rules for judges that still hold sway.
First up, don’t be biased, treat everyone the same,
Rich, poor, black, white, don’t play no favorites, that’s the name of the game…”
Tekoälyn täytyy tuntea tekijän tuotanto tarkkaan, että se kykenee toisintamaan alkuperäisaineiston tai sen tekijän tyyliä. Tämä on mahdollista sen ansiosta, että neuroverkolle on syötetty valtava massa alkuperäisiä teoksia. Kun neuroverkkoa koulutetaan, siinä samassa alkuperäistä aineistoa kopioidaan eli tekijänoikeudellisesti aineistosta valmistetaan kappaleita.
Teosten hyödyntäminen valmistamalla niistä kappaleita edellyttää tekijänoikeudenhaltijan lupaa, ellei jokin tekijänoikeuden rajoitus tai poikkeus sovellu. Toistaiseksi julkaistujen sovellusten kehittäjät eivät ole pääsääntöisesti lupia kyselleet, joten on oletettavissa, että Getty Images -juttu saa tulevaisuudessa seuraajia.
Voivatko tekijänoikeuden poikkeukset ja rajoitukset soveltua tekoälyn opettamiseen?
Teoriassa olisi mahdollista, että jokin tekijänoikeuden poikkeus tai rajoitus tulisi sovellettavaksi. Tutkija Juha Vesala on pohtinut, että eurooppalaisessa kontekstissa kyseeseen saattaisi tulla DSM-direktiiviin artiklan 4 mukainen tiedonlouhinta kaupalliseen tarkoitukseen tai tietoyhteiskuntadirektiivin artiklan 5 mukainen tilapäinen kappaleen valmistaminen.
Kumpikaan näistä ei laajassa mittakaavassa vapauta tekoälysovelluksen kehittäjää velvollisuudesta hankkia lupaa oikeudenhaltijoilta näiden teosten käyttämiseen.
Ensinnäkin artiklan 4 mukainen tiedonlouhinta on sallittua vain, jos oikeudenhaltijat eivät ole pidättäneet tätä oikeutta. Lisäksi DSM-direktiivi on hyväksytty 2019 ja se tuli saattaa kansallisesti voimaan kesäkuussa 2021. Lue lisää DSM-direktiivistä aiemmasta näkökulmastani. Tekoälysovellusten kehittäjät ovat kuitenkin louhineet teoksia jo tätä ennen neuroverkkojen kouluttamiseen. Voivatko sovelluskehittäjät siis vedota artiklaan 4 jos louhinta on tapahtunut ennen direktiivin voimaan saattamista? Väittäisin, että eivät voi.
Yhtä epätodennäköistä on, että Stable Diffusionin, ChatGPT:n tai Googlen MusicLM:n taustalla olevien neuroverkkojen kouluttamiseen soveltuisi tilapäisen kappaleen valmistamisen poikkeus. Tämä jo siitä yksinkertaisesta syystä, että poikkeuksen soveltuminen edellyttäisi, että kappaleen valmistaminen olisi tilapäistä.
Artiklan mukaan sallittu tilapäinen kappaleen valmistaminen on väliaikaista tai satunnaista, sekä erottamaton ja välttämätön osa teknistä prosessia, ja jonka ainoa tarkoitus on mahdollistaa
- välittäjän toimesta tapahtuva teoksen tai muun aineiston siirto verkossa kolmansien osapuolien välillä tai
- sen laillinen käyttö
… ja jolla ei ole itsenäistä taloudellista merkitystä.
Pidän epätarkoituksenmukaisena, että massiivinen aineistojen kopioiminen neuroverkkojen kouluttamiseksi, jotta se kykenisi toisintamaan alkuperäisteosten ominaisuudet, voisi täyttää edellytykset.
Lisäksi kolmen kohdan testin mukaan tekijänoikeuden poikkeuksia ja rajoituksia voidaan ylipäänsä soveltaa vain tietyissä erityistapauksissa, jotka eivät ole ristiriidassa teoksen tai muun aineiston tavanomaisen hyödyntämisen kanssa, eivätkä kohtuuttomasti haittaa oikeudenhaltijan oikeutettuja etuja. Ei ole oikeuspoliittisesti kestävää, että kaupalliset yhtiöt voisivat vedota tekijänoikeuden poikkeukseen tai rajoitukseen silloin, kun ne hyödyntävät ilmaiseksi alkuperäisiä teoksia tarkoituksenaan mahdollistaa näiden alkuperäisten teosten kanssa kilpailevan sisällön tuottaminen.
Jos tekoälyn kehittäjät eivät voi vedota siihen, että teosten käyttäminen neuroverkkojen kouluttamisessa on tekijänoikeuden poikkeuksen tai rajoituksen piirissä, tulee käytöstä sopia oikeudenhaltijoiden kanssa.
Ongelma sopimisessa on, että ulkoa päin on hyvin hankala tietää mitä aineistoa kouluttamiseen on käytetty, eivätkä sovellusten kehittäjät ole olleet erityisen halukkaita kertomaan tästä vapaaehtoisesti.
Miten tekoälyasetus vaikuttaa tilanteeseen?
Euroopan parlamentti teki oikeudenhaltijoiden näkökulmasta oikeasuuntaisia muutoksia asetusluonnokseen. Parlamentti muun muassa lisäsi asetusluonnokseen uusia läpinäkyvyyden ja informoinnin velvoitteita generatiivisten tekoälysovellusten kehittäjille. Näiden sovellusten kehittäjien tulisi parlamentin ehdotuksen mukaisesti antaa esimerkiksi riittävän yksityiskohtainen yhteenveto koulutusaineistosta.
Tämä on erittäin positiivinen avaus parlamentilta ja kannatettava lähtökohta. Tehokkaan lisensoinnin mahdollistamiseksi informaation käytetystä aineistosta tulisi kuitenkin olla yhteenvetoa yksityiskohtaisempaa. Jotta oikeudenhaltijat voisivat mielekkäästi lisensoida teostensa käytön, tulisi oikeudenhaltijan pystyä tunnistamaan mitä teoksia ja miten kouluttamisessa on käytetty.
Toinen huomionarvoinen avaus parlamentilta liittyy perustamallien (foundation models) velvoitteisiin varmistaa, että mallien tuottamat tuotokset eivät riko Unionin oikeutta, tekijänoikeus mukaan lukien. Tältä osin olisi toivottavaa, että velvoite ulotettaisiin koskemaan tuotosten lisäksi koulutuksessa käytettävää materiaalia.
Yhä kiihtyvällä tahdilla kehittyvä tekoäly muuttaa pysyvästi tapaa tuottaa ja kuluttaa sisältöjä. Ei kuitenkaan pidä ajatella, että olisimme tässä kehityksessä pelkkiä matkustajia, vailla mahdollisuuksia vaikuttaa suuntaan tai määränpäähän.
On ilmeistä, että olemme keskellä suurta murrosvaihetta. Kuten komissio on todennut: ”AI comes with both opportunities and threats, and the balance will depend on our decisions”.
On hyvä, että EU pyrkii nyt luomaan tekoälylle reiluja pelisääntöjä. Toivottavasti myös Suomi tukee sellaista sääntelyä, joka ottaa oikeudenhaltijoiden oikeutetut näkökulmat huomioon, ja tukee läpinäkyvyyttä ja aineiston käytöstä sopimista tekoälyn kouluttamisessa.