Tekoälytyökalut ovat uusin luku musiikkiteknologian kehityksessä
Generatiivinen tekoäly ja muut tekoälytyökalut muuttavat musiikin tekemistä pysyvästi. Vaikka tekoälyn ja tekijänoikeuksien suhteen on tällä hetkellä ilmassa iso joukko avoimia kysymyksiä, on selvää, että mallien kehitys etenee nopeasti. Teoston Senior Advisor Ano Sirppiniemi tekee luotauksen tällä hetkellä tarjolla oleviin teknologiavaihtoehtoihin.
Musiikin ja uuden teknologian suhde on aina ollut tiivis. Teknologiset murrokset ovat muokanneet musiikin tekemisen ja kuluttamisen tapoja lukemattomin tavoin viimeisten vuosisatojen aikana.
Siinä, missä aiemmat murrokset ovat liittyneet ensisijaisesti tapoihin, joilla musiikkia tallennetaan, esitetään, jaellaan tai kulutetaan, tuorein tekoälymurros kohdistuu näiden lisäksi suoraan ja kouriintuntuvasti myös musiikin luovaan tekemiseen.
Noin viidesosa kotimaisista musiikin tekijöistä on kokeillut tai käyttää tekoälytyökaluja
Teoston tammikuussa 2025 musiikin tekijöille teettämässä tekoälykyselyssä reilu viidesosa vastaajista (21 %) sanoi kokeilleensa tai käyttävänsä tekoälyä tällä hetkellä musiikin tekemisessä.
Eniten vastaajat kertoivat käyttävänsä tekoälyä sävellyksen, sanoituksen ja luovan prosessin tukemiseen. Lähes yhtä suuri osa sanoi käyttävänsä tekoälyä eri tavoin äänitys-, miksaus-, ja masterointivaiheissa. Näiden lisäksi tekoälytyökaluja käytettiin usein esimerkiksi musiikkiin liittyvän promosisällön ja markkinointiaineiston tuottamiseen.
Kyselyssä yleisimmin mainittuja tekoälytyökaluja olivat:
- ChatGPT
- Suno
- Udio
- Izotope
- Midjourney
- Adobe AI -työkalut
- Copilot
- Stable Diffusion
- Lalal.ai
- ACE Studio.
Työkaluista ylivoimaisesti suosituin oli ChatGPT, jota käytettiin monipuolisesti sanoitusten ideoinnista markkinointisisällön tuottamiseen.
Vaikka tekoälyyn liittyvään sääntelyyn ja tekijänoikeuksien lisensiointimalleihin liittyy paljon avoimia kysymyksiä (ja uhkiakin), musiikin tekemisen näkökulmasta tekoälyn hyödyntäminen tarjoaa myös uusia mahdollisuuksia.
Tilaa TeoStory-uutiskirje
Haluatko tiedon uusista TeoStory-artikkeleista sähköpostiisi? Tilaa TeoStory-uutiskirje, niin saat kuukausittain koosteen uusista jutuistamme!
Tekoälysovelluksia ja palveluita on tarjolla moneen vaiheeseen musiikin tekemisessä
Tekoälysovellukset ja -palvelut voidaan musiikin tekemisen näkökulmasta jaotella luokkiin sen perusteella, mihin käyttötarkoitukseen ne on tarkoitettu, tai mihin ne sopivat parhaiten. Pääluokkia on tällä hetkellä kahdeksan.
1. Tekoälyominaisuudet musiikintuotanto-ohjelmistoissa
Musiikintuotanto-ohjelmistoissa (DAW, digital audio workstation) ja niiden kanssa käytettävissä plug-in-sovelluksissa eli plugareissa on jo pitkään hyödynnetty erilaisia koneoppimiseen ja algoritmeihin liittyviä ominaisuuksia, joiden avulla on mahdollista automatisoida ja nopeuttaa biisien tuottamiseen liittyviä työvaiheita.
Nämäkin ominaisuudet kehittyvät nopeasti puhtaasti teknisistä työkaluista (efektit, miksaus, masterointi) luoviksi apureiksi – yhtenä esimerkkinä kyselyvastauksista voi nostaa Applen Logic-ohjelmistoon viime vuonna lanseeraamat tekoälysoittajat (Session players), joiden avulla on mahdollista luoda nopeasti demoversio tai työversio työn alla olevasta biisistä.
2. Tekoälyavusteinen miksaus ja masterointi
Äänitteen viimeistelyvaiheisiin eli miksaukseen ja masterointiin on ollut jo pitkään saatavilla sovelluksia ja palveluita, joilla tämä työvaihe on ollut mahdollista tuottaa nopeasti ja automatisoidusti.
Esimerkkejä masterointipalveluista/-sovelluksista ovat Teoston kyselyssä vastaajien usein mainitsemat Landr ja Izotope Ozone. Nykyään myös DAW-ohjelmistoissa on omia kehittyneitä masterointityökaluja.
Nettikeskusteluissa ja kommenteissa kiistellään yhä siitä, saadaanko näillä työkaluilla ammattitason jälkeä aikaan, mutta ainakin melko hyvää on mahdollista tehdä nopeasti, jopa minuuteissa.
3. Raitojen ja osien erottaminen valmiista äänitteistä (stem separation)
Tekoäly on mahdollistanut ison laadullisen loikan raitojen erottelussa: monien tekoälysovellusten avulla minkä tahansa äänitteen voi purkaa kohtuullisen hyvin tuloksin takaisin erillisiksi raidoiksi tai joukoksi instrumenttiraitoja (stems).
Esimerkkejä Teoston tekijöiden mainitsemista tekoälypalveluista ovat Lalal.ai, Moises ja Fadr. Tämäkin ominaisuus on nopeasti vakioitumassa useimpien tuotanto-ohjelmistojen ja plugareiden vakio-ominaisuudeksi (esim. Logic, FL Studio, Izotope RX, Landr).
Myös monet tekoälymusiikkipalvelut, joissa kappaleita voi tuottaa tekstipromptien avulla, mahdollistavat nykyisin tekoälytuotosten erottelemisen stemmoiksi tai yksittäisiksi raidoiksi.
Lienee syytä mainita, että äänitteen erottelu raidoiksi ei poista alkuperäisen äänitteen tai teoksen tekijänoikeuksia.
4. Sanoitusideoiden tuottaminen kielimallien avulla
Isot kielimallit pystyvät tuottamaan nopeasti ison joukon fraaseja, tekstinpätkiä tai kappaleiden nimiä esimerkiksi sanoitusten tai biisi-ideoiden lähtökohdaksi.
Kielimalleista Teoston tekoälykyselyn perusteella Open AI:n ChatGPT oli selvästi useimmin tähän tarkoitukseen käytetty palvelu.
5. Valmiin musiikin tuottaminen tekstipromptien avulla
Useat tekoälypalvelut mahdollistavat musiikin luomisen tekstipromptien avulla. Näkyvimpiä ja usein Teoston kyselyssä mainittuja esimerkkejä tämänkaltaisista palveluista ovat Suno ja Udio, joita molempia vastaan on käynnissä oikeusjuttuja liittyen niiden käyttämään koulutusaineistoon.
Palveluiden avulla on mahdollista tuottaa tekstipromptin avulla (esim. kuvailemalla kappaleen tyyliä, instrumentaatiota, tunnelmaa jne.) nopeasti valmiilta äänitteeltä kuulostava tuotos. Palvelut tuottavat myös sanoituksen; tarvittaessa promptiin voi sisällyttää oman sanoituksen, jota palvelu hyödyntää.
Näiden palvelujen myötä promptaamisesta eli toivotun lopputuloksen tilaamisesta on syntymässä oma taitonsa. Palvelut kehittävät jatkuvasti ominaisuuksia, joiden avulla syntyvän lopputuloksen rakennetta ja yksityiskohtia voisi hallita.
6. Musiikin tuottaminen audiopromptien avulla
Monet tekoälypalvelut mahdollistavat musiikin tuottamisen myös lataamalla palveluun oman äänitteen tai katkelman, jonka pohjalta tekoäly tuottaa jatkoa tai erilaisia versioita.
Tämän ominaisuuden kohdalla kannattaa olla tarkkana erityisesti generatiivisten musiikkipalveluiden käyttöehtojen suhteen.
Selvitä, mitä käyttöehdot sanovat palveluun ladatun ääniaineiston oikeuksista, jotta et tule tahattomasti luovuttaneeksi oikeuksia, joita et tahdo luovuttaa (tai joita sinulla ei edes ole). Sama koskee tietysti myös palveluun vietyjä omia sanoituksia.
7. Laulajien äänen mallintaminen tekoälyn avulla
Mahdollistaa erilaisten laulajien ja lauluäänien kokeilemisen ja vaihtamisen demoissa, tai taustalaulujen luomisen eri lauluäänien avulla.
Esimerkkejä Teoston tekoälykyselystä: Audimee, ACE Studio AI, puheen tuottamisessa Eleven Labs. Eri palvelut mahdollistavat myös omien äänikloonien tuottamisen oman äänen perusteella.
8. Omien tekoälymallien kouluttaminen tai räätälöinti
Vaikka isot kielimallit vaativat järeitä tuotantoympäristöjä, jo nyt on nähtävillä, että erilaiset kevyemmät, pienet kielimallit ja avoimen lähdekoodin tekoälymallit ovat tulossa laajemman joukon käytettäviksi.
Nämä mallit tulevat mahdollistamaan omien tekoälymallien kouluttamisen tai ison kielimallin virittämisen omalla koulutusaineistolla.
Erilaiset räätälöidyt musiikintuotantomallit ovat varmasti myös yksi musiikin tekoälytyökalujen tuleva polku. Mallien kouluttaminen ja räätälöiminen vaatii tyypillisesti syvempää teknistä osaamista ja perehtymistä kuin valmiiden sovellusten tai ohjelmistojen käyttäminen.
Kehitys jatkaa kehittymistään, kuten tähänkin asti
Yhdestä näkökulmasta nyt käynnissä oleva tekoälymurros on jatkoa musiikin ja teknologian pitkään jatkuneelle, usein kitkaisellekin rinnakkaiselolle.
Tässä listattuna muutama entisaikojen murroksista.
- Valurautarunkoinen flyygeli oli 1800-luvun alkupuolella aikansa huipputeknologiaa ja muutti musiikin tekemisen ja esittämisen käytäntöjä, puhumattakaan äänitysteknologioiden keksimisestä saman vuosisadan lopulla.
- Äänielokuva – ääniraidan synkronointi optisesti filminauhalle – vei Suomessakin elokuvaorkesterien soittajilta työpaikat 1929–30. Samaan aikaan gramofonikuume valtasi alaa, ja äänilevyjen ja levysoittimien myynti kasvoi nopeasti.
- Moniraitaäänitys, c-kasetti, musiikkivideot, syntetisaattorit ja MIDI, samplerit, digitaalinen äänittäminen, vertaisverkot ja striimauspalvelut – tekoälytyökalut ovat tästä näkökulmasta vain seuraava luku musiikkiteknologian kehitysjatkumossa.
Joskaan algoritmien tuottama tai generatiivinen musiikki eivät nekään ole musiikin luovassa tekemisessä uusia asioita; riippuen katsantokannasta generatiivisen musiikin juuria voidaan johtaa vaikkapa Mozartin kokeiluihin, 1900-luvun sarjallisuuteen, minimalisteihin, nauhamusiikin säveltäjiin tai populaarimusiikin puolella esimerkiksi Brian Enon tuotantoon.
Samaten pelimusiikissa adaptiivisuus ja interaktiivisuus – musiikin reagointi pelimaailman tapahtumiin - ovat aina olleet keskeisiä ilmiöitä. Niitä on toteutettu tietokonepeleissä eri tavoin – myös hyödyntäen koneoppimista, algoritmeja ja tekoälymalleja.
Vaikka teknologiset murrokset ovat aina olleet vaikutuksiltaan ristiriitaisia, ne luovat myös uudenlaisia mahdollisuuksia musiikin tekemiseen. Usein murroskohdissa vanhat tekemisen tavat eivät ole kadonneet, mutta niiden rinnalle on tullut uusia tapoja.
Tilaa TeoStory-uutiskirje
Haluatko tiedon uusista TeoStory-artikkeleista sähköpostiisi? Tilaa TeoStory-uutiskirje, niin saat kuukausittain koosteen uusista jutuistamme!