Lainaa vain? - väitös musiikkiesitysten lainakappaleiden tunnistamisesta

Miksi musiikkiesitysten lainakappaleiden automaattinen tunnistaminen on niin vaikeaa kuin se on, kysyy Helsingin yliopistossa aiheesta väittelevä Teppo E. Ahonen.

Lainakappeleiksi kutsutaan musiikkiesityksiä, jotka ovat eri esittäjän tekemiä uusia tulkintoja kappaleen alkuperäisen esittäjän tekemästä versiosta. Lainakappaleet voivat olla hyvinkin samanlaisia alkuperäisversioiden kanssa, ja joskus versioilla on vain nimellisesti yhtäläisyyksiä.

Ihmisille lainakappaleiden tunnistaminen on yleensä helppoa, jos alkuperäisesitys on tuttu.

- Lainakappaleiden automaattinen, algoritmeihin perustuva tunnistaminen, on kuitenkin huomattavan haastava ongelma, eikä täysin tyydyttäviä ratkaisuja ole vielä esitetty, sanoo Teppo E. Ahonen, joka katsoo, että ongelman ratkaisulla olisi tutkimuksellisesti ja kaupallisesti potentiaalisia sovelluskohteita; sellainen olisi esimerkiksi plagioinnin automaattinen tunnistaminen.

Teppo E. Ahosen tietojenkäsittelytieteen alan väitöskirjassa lainakappeleiden automaattista tunnistamista käsitellään informaatioteoreettisesta lähtökohdasta. Tutkimuksessa selvitetään, pystytäänkö kappaleiden sisältämää tonaalista samanlaisuutta mittaamaan siten, että sen perusteella voidaan todeta eri esitysten olevan pohjimmiltaan saman sävellyksen eri tulkintoja.

Tutkimus on tehty laajalla aineistolla audiomuotoista populaarimusiikkia, jossa signaalidata on muunnettu merkkijonomuotoiseksi niin, että prosessin tulos edelleen kuvaa kappaleen keskeisiä musiikillisia yksilöiviä piirteitä.

Tutkimuksessa todettiin, että pienetkin muutokset kappaleissa voivat vaikuttaa suuresti kappaleiden laskennallisiin etäisyyksiin, mutta monissa tapauksissa vaikutus on myös mahdollista minimoida.

- Yksittäisten piirteiden aiheuttamat haastavuudet on myös jossakin määrin mahdollista kiertää yhdistämällä useita piirteitä tunnistamisessa, väittelijä sanoo.

Lopputuloksena väitöskirja esittelee tiedontiivistystä hyödyntävän järjestelmän lainakappaleiden tunnistamiseen. Sen vahvuuksia ovat yksinkertaisuus ja robustisuus useita kappaleissa esiintyviä musiikillisia muutoksia kohtaan.

- Selvimpiä heikkouksia ovat etäisyysmetriikan painottama kappaleiden globaalin samanlaisuuden mittaaminen lokaalien samanlaisuuksien kustannuksella, Ahonen sanoo.

- Lisäksi yksittäisistä kappaleista saadaan irrotettua melko vähän informaatiota, minkä vuoksi tiedontiivistysalgoritmeja ei saada hyödynnettyä täydellä tehollaan.

Teppo E. Ahonen väittelee Helsingin yliopistossa tohtoriksi tietojenkäsittelytieteen alalta perjantaina 1.4.2016 otsikolla Cover Song Identification Using Compression-based Distance Measures.

Väittelijän yhteystiedot:
Teppo E. Ahonen, teahonen@cs.helsinki.fi

Ystävällisin terveisin
Minna Meriläinen-Tenhu, 050 415 0316, @MinnaMeriTenhu