Koneoppiminen : ohjattu oppiminen taloustieteellisessä tutkimuksessa
Jauhiainen, Jukka-Pekka (2019-06-04)
Jauhiainen, Jukka-Pekka
J.-P. Jauhiainen
04.06.2019
© 2019 Jukka-Pekka Jauhiainen. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-201906052387
https://urn.fi/URN:NBN:fi:oulu-201906052387
Tiivistelmä
Tämän tutkielman tarkoituksena on selvittää, voitaisiinko koneoppimista hyödyntää taloustieteellisessä tutkimuksessa. Koneoppiminen on saavuttanut viime vuosina suurta suosiota ja koneoppimista on sovellettu lukuisten erilaisten ongelmien ratkaisemiseksi. Viime vuosina myös taloustieteilijöiden keskuudessa on alkanut herätä mielenkiintoa koneoppimista kohtaan. Koneoppiminen voidaan jakaa kahteen osa-alueeseen: ohjattuun oppimiseen ja ohjaamattomaan oppimiseen. Ohjatun oppimisen ja perinteisten ekonometrian menetelmien tavoite on periaatteessa sama ja ohjatun oppimisen menetelmiä voitaisiinkin mahdollisesti soveltaa tutkimuskäytössä perinteisten ekonometrian menetelmien tapaan.
Tutkielman teoria osuudessa käsitellään koneoppimisen keskeisiä perusperiaatteita sekä useiden koneoppimismenetelmien toimintaperiaatteita. Teoria osuudessa käsitellään lisäksi koneoppimisen ja perinteisten ekonometrian menetelmien eroja sekä mitä ongelmia koneoppimismenetelmiin liittyy.
Koneoppimisen paremmuutta perinteisiin tilastollisiin menetelmiin verrattuna perustellaan niiden paremmalla ennustamiskyvyllä. Koneoppimismenetelmien avulla voidaan sovittaa aineistoihin hyvinkin monimutkaisia malleja ja niiden avulla voidaan aineistosta löytää rakenteita, joita ei perinteisten menetelmien avulla voida löytää. Koneoppimisen soveltamisessa tutkimuskäyttöön liittyy kuitenkin joitain ongelmia. Yksi keskeinen ongelma on se, että koneoppimismenetelmiä ei ole suunniteltu syy-seuraussuhteiden selvittämiseen vaan ne on suunniteltu puhtaasti ennustamistarkoitukseen. Viime aikoina on kuitenkin pyritty kehittämään uusia koneoppimismenetelmiä, joiden avulla voidaan estimoida myös syy-seuraussuhteita.
Tutkielman empiirisessä osuudessa vertaillaan koneoppimismenetelmiä sekä ekonometriassa perinteisesti käytettävää logistista regressiota. Empiirisessä osuudessa pyrittiin ennustamaan portugalilaisen pankin asiakkaiden käytöstä. Empiirisen osuuden lopputulokseksi saatiin se, että koneoppimismallit eivät olleet merkittävästi parempia ennustamaan kuin logistinen regressiokaan.
Tutkielman tuloksena voidaan sanoa, että koneoppimista voidaan hyödyntää taloustieteellisessä tutkimuksessa. Mutta kuten tutkielman empiirisestä osuudesta nähdään, niin koneoppimismenetelmät eivät välttämättä ole joka tilanteessa perinteisiä regressiomalleja parempia. Suurin potentiaalinen käyttökohde koneoppimiselle onkin suurten tietoaineistojen eli niin sanotun big datan analysointi.
Tutkielman teoria osuudessa käsitellään koneoppimisen keskeisiä perusperiaatteita sekä useiden koneoppimismenetelmien toimintaperiaatteita. Teoria osuudessa käsitellään lisäksi koneoppimisen ja perinteisten ekonometrian menetelmien eroja sekä mitä ongelmia koneoppimismenetelmiin liittyy.
Koneoppimisen paremmuutta perinteisiin tilastollisiin menetelmiin verrattuna perustellaan niiden paremmalla ennustamiskyvyllä. Koneoppimismenetelmien avulla voidaan sovittaa aineistoihin hyvinkin monimutkaisia malleja ja niiden avulla voidaan aineistosta löytää rakenteita, joita ei perinteisten menetelmien avulla voida löytää. Koneoppimisen soveltamisessa tutkimuskäyttöön liittyy kuitenkin joitain ongelmia. Yksi keskeinen ongelma on se, että koneoppimismenetelmiä ei ole suunniteltu syy-seuraussuhteiden selvittämiseen vaan ne on suunniteltu puhtaasti ennustamistarkoitukseen. Viime aikoina on kuitenkin pyritty kehittämään uusia koneoppimismenetelmiä, joiden avulla voidaan estimoida myös syy-seuraussuhteita.
Tutkielman empiirisessä osuudessa vertaillaan koneoppimismenetelmiä sekä ekonometriassa perinteisesti käytettävää logistista regressiota. Empiirisessä osuudessa pyrittiin ennustamaan portugalilaisen pankin asiakkaiden käytöstä. Empiirisen osuuden lopputulokseksi saatiin se, että koneoppimismallit eivät olleet merkittävästi parempia ennustamaan kuin logistinen regressiokaan.
Tutkielman tuloksena voidaan sanoa, että koneoppimista voidaan hyödyntää taloustieteellisessä tutkimuksessa. Mutta kuten tutkielman empiirisestä osuudesta nähdään, niin koneoppimismenetelmät eivät välttämättä ole joka tilanteessa perinteisiä regressiomalleja parempia. Suurin potentiaalinen käyttökohde koneoppimiselle onkin suurten tietoaineistojen eli niin sanotun big datan analysointi.
Kokoelmat
- Avoin saatavuus [32202]