FastICA-algoritmin erottelukyky äänimaisema-analyysissä

Iso-Junno, Ilari; Särkiniemi, Mikko

FastICA-algoritmin erottelukyky äänimaisema-analyysissä

Iso-Junno, Ilari; Särkiniemi, Mikko (2016-06-22)

Avaa tiedosto

nbnfioulu-201609282841.pdf (1.446Mt)

nbnfioulu-201609282841_pdfa_report.xml (175.0Kt)

nbnfioulu-201609282841_mods.xml (14.83Kt)

nbnfioulu-201609282841_solr.xml (33.44Kt)

Lataukset:

Iso-Junno, Ilari

Särkiniemi, Mikko

I. Iso-Junno; M. Särkiniemi

22.06.2016

© 2016 Ilari Iso-Junno, Mikko Särkiniemi. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.

Näytä kaikki kuvailutiedot

Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-201609282841

Tiivistelmä

Ihmisen kuuloaisti kykenee erottelemaan ympäristöstään yksittäisiä ääniä erinomaisella tarkkuudella. Sitä on pyritty jäljittelemään monilla erilaisilla koneellisilla menetelmillä, mutta yksikään niistä ei ole saavuttanut ihmisen kuuloaistin erottelukykyä. Näistä menetelmistä hyödyllisimpiä ovat sokeat signaalin erottelumenetelmät (BSS), joissa äänilähteistä ei tiedetä mitään ennakkoon. Tässä työssä äänilähteiden erotteluun käytetään riippumattomien komponenttien analyysiä (ICA), joka on tehokas BSS-menetelmä. Tällä hetkellä ICA:lla kyetään hyvin erottelemaan äänilähteitä, mutta sen rajoituksia ovat muun muassa mikrofonien lukumäärä, äänilähteiden tilastollinen riippumattomuus, äänilähteiden liikkumattomuus sekä permutaatio ja skaalaus -ongelma.

Tässä työssä kehitetyn ohjelmiston toteutus pohjautuu valmiiseen FastICA-algoritmiin, joka on tällä hetkellä yksi nopeimmista olemassa olevista ICA-algoritmeista. FastICA:n erottelukykyä arvioidaan koherenssilla 2–19 äänilähteen erottelussa. Tulokset osoittavat, että FastICA:n erottelukyky heikkenee äänilähteiden lukumäärän kasvaessa ja samankaltaiset äänilähteet eivät erotu hyvin. Lisäksi matalataajuiset signaalit osoittautuivat huonosti erottuviksi. Erinomaiseen erottelutulokseen päästään alle kahdeksalla äänellä, jolloin yli 95 % äänistä erottuu hyvin. Jatkotutkimuksessa tulisi keskittyä lisämenetelmiin, joilla voisi paikata ICA:n rajoituksia.

The human sense of hearing is able to separate individual sounds in the environment with extraordinary accuracy. Several attempts have been made to imitate it artificially but so far none of these methods have achieved the performance of the human sense of hearing. The most useful of these methods is blind signal separation (BSS) since it does not need any preliminary information on the sound sources. This work used independent component analysis (ICA) for separating sound sources. ICA is an efficient blind signal separation technique. At the moment, ICA is able to separate sound sources well but it has limitations such as the amount of microphones used, statistical independence between sound sources, immobility of sound sources and the permutation and scaling problem.

The software developed for this Bachelor’s thesis is based on the FastICA algorithm, which is currently one of the fastest ICA algorithms in existence. The accuracy of FastICA is measured by calculating the coherence in the separation of 2 to 19 sound sources. The results indicate that the separation performance of FastICA decreases as the number of sources increases and similar sound sources are not separated all that well. Additionally, low frequency signals are separated poorly. The separation performance is excellent with less than eight sound sources and over 95 % of sounds will separate well. In conclusion, it can be said that further research is needed in order to develop methods that deal with the limitations of ICA.

Kokoelmat

Avoin saatavuus [32026]