Siirry sisältöön
Kirjoittaja: Ano Sirppiniemi
Kuva: Suvi-Tuuli Kankaanpää

Datan laatu ratkaisee musiikkialan tekoälymurroksen suunnan

Tekoäly muuttaa vääjäämättömästi musiikkialaa. Muutoksen nopeus ja syvyys ovat kuitenkin vielä arvailun kohteena: miten nopeasti tekemisen tavat ja markkinat muuttuvat? Miten laajasti tavalliset musiikinkuuntelijat ovat valmiita omaksumaan tekoälyn tekemää tai sen avustuksella tehtyä musiikkia? Teoston ennakoinnista ja teknologioista vastaava Senior Advisor Ano Sirppiniemi pohtii aihetta näkökulmassaan.

Tekoäly on ollut vuoden 2024 suurin puheenaihe, eikä musiikkiala ole tästä poikkeus. Poikkeuksellista tekoälyn aiheuttamassa murroksessa verrattuna aiempiin musiikkialan muutoksiin on se, että se kohdistuu samanaikaisesti kaikkiin musiikkialan toimijoihin, tekijöihin ja prosesseihin. Aina musiikin tekemisestä sen tuotantoon, jakeluun, markkinointiin ja kulutukseen asti.

Tekoälyn tuomat muutokset muokkaavat teknologiamurroksille tyypillisesti toimialojen perinteisiä rooleja ja toimijoiden välisiä suhteita. Kun yleiskäyttöiset generatiiviset tekoälymallit mahdollistavat kuvien, videoiden, tekstien ja musiikin tuottamisen pelkkien tekstikehotteiden avulla, on tällä luoville aloille monenlaisia vaikutuksia. Sisällön määrä todennäköisesti kasvaa räjähdysmäisesti.

Millä tavoin tekoälytyökaluja hyödynnetään tulevaisuudessa eri käyttötilanteissa? Miten ne muuttavat musiikin tekemistä ja sen kuuntelua?  

Kun tekoäly yleistyy, on tärkeää pyrkiä monipuolistamaan ja tarkentamaan kuvaa siitä, miten se vaikuttaa musiikkialalla yksittäisiin käytännön tilanteisiin ja musiikin tekemiseen.

Tekoälyn käyttö musiikkialalla yleistyy ja monipuolistuu 

Tekoälyn hyödyntäminen musiikissa ei ole ainoastaan yksi kokonaisuus, vaan murros toteutuu yksittäisten ihmisten, yritysten ja toimijoiden valintojen kautta lukemattomissa käyttötilanteissa ja yhteyksissä.

Julkisesti tähän asti näkyvintä on ollut keskustelu yleiskäyttöisten tekoälymallien ja -palveluiden käytöstä, ja luovilla aloilla erityisesti mallien kouluttamiseen käytetystä aineistosta ja mallien niiden pohjalta tuottamista aineistoista. Yleiskäyttöiset mallit tuottavat tyypillisesti teksti-, kuva- tai äänikehotteiden pohjalta tuotoksia, jotka perustuvat mallin kehittämisessä käytettyyn koulutusaineistoon.  

Yleiskäyttöisiä malleja ovat esimerkiksi ChatGPT, Midjourney tai musiikin osalta Suno ja Udio. Kaikilla näistä palveluista on käynnissä julkisuudessa esillä olleita oikeusjuttuja. Tapauksissa pohditaan tekijänoikeuksien toteutumista juuri mallien kouluttamisessa käytetyn aineiston ja niiden tuotosten näkökulmasta.  

Tähän mennessä eniten keskusteluissa pinnalla ovat olleet erityisesti nämä kolme musiikin tekoälypalveluiden käyttötapaa:

  1. musiikkisisällön tuottaminen tekstikehotteiden avulla
  2. laulajien äänen kloonaaminen sekä
  3. instrumenttiraitojen erottelu valmiista äänitteestä.

Nämä ovat kuitenkin vain yksi haara tekoälyn eri käyttömahdollisuuksista musiikissa.  Jatkossa on todennäköisesti yleisempää hyödyntää erilaisia personoituja ja omalla koulutusaineistolla viritettyjä, yleiskäyttöisiä tekoälymalleja.

Tekoälymalleja on tulevaisuudessa todennäköisesti mahdollista jatkokouluttaa omalla aineistolla, jolloin malli tuottaisi käyttäjän omien teosten kaltaisia tuotoksia joko hyödynnettäväksi sellaisenaan tai jatkotyöstöön.  

Musiikin tuotantoprosesseissa ja sen suosittelussa kuuntelijoille erilaiset algoritmeihin ja koneoppimiseen perustuvat tekoälyominaisuudet ovat olleet arkipäivää jo pitkään. Musiikin tekemisen tuotantoprosesseissa tekoälytyökaluilla on sen sijaan mahdollista nopeuttaa ja automatisoida eri työvaiheita, mikä helpottaa ja nopeuttaa musiikin tekemisen tuotantovaiheita.

Tämä edistää kehitystä, jossa yhtä laajempi käyttäjäjoukko pystyy tekemään ammattimaisen kuuloista musiikkia.  Työkalut auttanevatkin todennäköisesti eniten DIY-tekijöiden ja harrastajien mahdollisuuksia tuottaa musiikkia aiempaa nopeammin, edullisemmin ja laadukkaammin.   

Tekoälyn sääntelyä pohditaan juuri nyt

Tekoälyyn liittyvän sääntelyn osalta tapahtuu juuri nyt merkittäviä liikkeitä. Tekoälyn ja tekijänoikeuksien suhdetta määritellään parhaillaan myös joukossa näkyviä oikeusjuttuja. Yksi isoimmista on saksalaisen tekijänoikeusjärjestö GEMAn ja OpenAI:n tapaus, jossa GEMA haastoi OpenAI:n oikeuteen kappaleiden lyriikoiden käytöstä tekoälymallin kouluttamiseen ilman tekijöiden lupaa.

Samaan aikaan EU:n tekoälyasetus on astumassa vaiheittain voimaan, ja asetukseen liittyviä käytännesääntöjä luodaan par’aikaa. Lue lisää lakiasiainjohtajamme Jenni Kyntölän blogista.

Tekoälymallit mahdollistanevat tulevaisuudessa yhä tehokkaammin myös erityylisten versioiden tuottamisen malliksi annetusta äänitteestä. Osittain tämä on mahdollista jo nyt, mutta suosittelen kuitenkin perehtymään tarkasti palveluiden käyttöehtoihin. Kaupallisia tekoälymusiikkipalveluita käytettäessä on erittäin tärkeää huolehtia, mitä käyttöehdoissa mainitaan mallille syötetyn aineiston ja sen tuotosten oikeuksista.

Musiikin määrä kasvaa

Musiikin kuluttamisen ja suosittelun osalta on mielenkiintoista nähdä, millaiseksi kokonaan tekoälyllä tuotetun musiikin rooli muodostuu suhteessa ihmisten tekemään musiikkiin. Asiassa on roolinsa niin musiikkipalveluilla kuin niiden kuluttajilla. Ovatko kuluttajat valmiita hyväksymään tekoälyn tuottaman musiikin?

Miten musiikkipalveluissa erotellaan ja ilmaistaan kuluttajille tekoälyn kokonaan tuottama sisältö ja ihmisten tuottama musiikki? Miten suosittelualgoritmit mahdollistavat erityyppisen musiikin löytämisen jatkossa, etenkin jos julkaistavan musiikin määrä jatkaa tekoälyn vuoksi edelleen voimakasta kasvuaan? 

Näihin kysymyksiin saamme ratkaisuja vasta tulevaisuudessa.

Tekoäly haastaa tekijänoikeusinfrastruktuurin toimivuuden  

Kaikkea musiikkidataan, standardeihin, tunnisteisiin ja tietojärjestelmiin sekä niiden päälle rakennettuihin palveluihin perustuvia toimintoja voidaan nimittää tekijänoikeusinfrastruktuuriksi. Tämä on rakenne, jonka tarkoituksena on mahdollistaa tekijänoikeuksiin liittyvien lupien ja käyttöjen hallinnointi ja korvausten tilittäminen teosten oikeudenomistajille.

Tekijänoikeusinfrastruktuuri on laaja globaali verkosto, johon on eri tavoin kytkeytynyt valtava määrä toimijoita eri rooleissa tuottamaan, lähettämään, vastaanottamaan ja käsittelemään musiikin käytöstä syntyvää dataa. 

Verkostossa käsiteltävän datan määrä kasvaa jatkuvasti. Esimerkiksi vuonna 2023 brittiläinen tekijänoikeusjärjestö PRS totesi käsitelleensä vuodessa 27 biljoonaa riviä musiikinkäyttödataa. Yhdysvaltalaisen Luminate-tutkimusyrityksen mukaan musiikkia sisältäviä audio- ja videostriimejä kulutettiin vuonna 2023 yli seitsemän biljoonaa kertaa. Striimausten määrä kasvoi edellisvuodesta yli 30 prosenttia.

Käytön jakauma on kuitenkin hyvin polarisoitunut: hyvin pientä osaa julkaistuista äänitteistä kuunnellaan hyvin paljon. Luminaten tutkimuksen mukaan valtaosaa kaikesta julkaistusta musiikista kuunnellaan vuodessa alle 10 striimin verran.

Metadatan laatu ratkaisee, edelleen 

Laadukkaan musiikkiin (teoksiin ja äänitteisiin) liittyvän käyttötiedon ja metadatan merkitys tekijänoikeuksien hallinnoinnissa on valtavan suuri.  Prosessoitavan datamäärän kasvu on ollut voimakasta tietysti jo ennen tekoälymurrosta, kun musiikin onlinekäyttö on kasvanut. Myös julkaistun musiikin määrä on kasvanut rajusti viimeiset kymmenen vuotta. 

Tekoälyn hyödyntäminen tuo lisää haasteita metadatan hallinnointiin ja prosessointiin. Datan määrän kasvun lisäksi tekoälyn käyttö tuottaa uusia tarpeita datan käsittelylle uusien tunnisteiden sekä datan jakamiseen liittyvien standardien ja käytäntöjen kautta.

Ihmisten tekemien teosten tunnistaminen ja tekijyyden osoittaminen nousee tärkeäksi. Jos tekoälyn tuottamaa sisältöä ja ihmisten tekemää musiikkia jaellaan ja käytetään samojen kanavien kautta, täytyy datan mahdollistaa näiden erottelu toisistaan. Datan laadusta huolehtiminen on siis kaikissa tekoälymurroksen vaiheissa tärkein tae sille, että musiikin oikeuksien hallinnointi onnistuu tehokkaasti ja tarkasti myös jatkossa.

Tärkeintä tekoälymurroksessa on nyt ja tulevaisuudessa:

  1. tekoälymallien koulutusaineistojen ja tuotosten lisensiointi
  2. ihmisten tekijyyden todentaminen ja erottelu tekoälyn tuottamasta aineistosta sekä
  3. ihmisten tekemän musiikin löydettävyyden varmistaminen musiikkipalveluissa.

Kaikki tämä pohjautuu siihen, että teosten metadatan on oltava kunnossa ja datan laatuun tulee panostaa jatkossa vieläkin enemmän. Kun teosten tunnisteet ja tiedot ovat ajan tasalla, ne saadaan kulkemaan eri toimijoiden verkostossa tehokkaasti.

Jaa somessa
Lue lisää