FastICA-algoritmin erottelukyky äänimaisema-analyysissä |
|
Author: | Iso-Junno, Ilari1; Särkiniemi, Mikko1 |
Organizations: |
1University of Oulu, Faculty of Information Technology and Electrical Engineering, Department of Computer Science and Engineering, Computer Science |
Format: | ebook |
Version: | published version |
Access: | open |
Online Access: | PDF Full Text (PDF, 1.4 MB) |
Pages: | 25 |
Persistent link: | http://urn.fi/URN:NBN:fi:oulu-201609282841 |
Language: | Finnish |
Published: |
Oulu : I. Iso-Junno; M. Särkiniemi,
2016
|
Publish Date: | 2016-10-03 |
Thesis type: | Bachelor's thesis |
Reviewer: |
Röning, Juha Tokola, Teemu |
Description: |
Tiivistelmä Ihmisen kuuloaisti kykenee erottelemaan ympäristöstään yksittäisiä ääniä erinomaisella tarkkuudella. Sitä on pyritty jäljittelemään monilla erilaisilla koneellisilla menetelmillä, mutta yksikään niistä ei ole saavuttanut ihmisen kuuloaistin erottelukykyä. Näistä menetelmistä hyödyllisimpiä ovat sokeat signaalin erottelumenetelmät (BSS), joissa äänilähteistä ei tiedetä mitään ennakkoon. Tässä työssä äänilähteiden erotteluun käytetään riippumattomien komponenttien analyysiä (ICA), joka on tehokas BSS-menetelmä. Tällä hetkellä ICA:lla kyetään hyvin erottelemaan äänilähteitä, mutta sen rajoituksia ovat muun muassa mikrofonien lukumäärä, äänilähteiden tilastollinen riippumattomuus, äänilähteiden liikkumattomuus sekä permutaatio ja skaalaus -ongelma. Tässä työssä kehitetyn ohjelmiston toteutus pohjautuu valmiiseen FastICA-algoritmiin, joka on tällä hetkellä yksi nopeimmista olemassa olevista ICA-algoritmeista. FastICA:n erottelukykyä arvioidaan koherenssilla 2–19 äänilähteen erottelussa. Tulokset osoittavat, että FastICA:n erottelukyky heikkenee äänilähteiden lukumäärän kasvaessa ja samankaltaiset äänilähteet eivät erotu hyvin. Lisäksi matalataajuiset signaalit osoittautuivat huonosti erottuviksi. Erinomaiseen erottelutulokseen päästään alle kahdeksalla äänellä, jolloin yli 95 % äänistä erottuu hyvin. Jatkotutkimuksessa tulisi keskittyä lisämenetelmiin, joilla voisi paikata ICA:n rajoituksia. The separation performance of the fastICA algorithm in auditory scene analysis Abstract The human sense of hearing is able to separate individual sounds in the environment with extraordinary accuracy. Several attempts have been made to imitate it artificially but so far none of these methods have achieved the performance of the human sense of hearing. The most useful of these methods is blind signal separation (BSS) since it does not need any preliminary information on the sound sources. This work used independent component analysis (ICA) for separating sound sources. ICA is an efficient blind signal separation technique. At the moment, ICA is able to separate sound sources well but it has limitations such as the amount of microphones used, statistical independence between sound sources, immobility of sound sources and the permutation and scaling problem. The software developed for this Bachelor’s thesis is based on the FastICA algorithm, which is currently one of the fastest ICA algorithms in existence. The accuracy of FastICA is measured by calculating the coherence in the separation of 2 to 19 sound sources. The results indicate that the separation performance of FastICA decreases as the number of sources increases and similar sound sources are not separated all that well. Additionally, low frequency signals are separated poorly. The separation performance is excellent with less than eight sound sources and over 95 % of sounds will separate well. In conclusion, it can be said that further research is needed in order to develop methods that deal with the limitations of ICA. see all
|
Subjects: | |
Copyright information: |
© Ilari Iso-Junno; Mikko Särkiniemi, 2016. This publication is copyrighted. You may download, display and print it for your own personal use. Commercial use is prohibited. |