Verkkorakenteiden estimointimenetelmät
Kinnunen, Miika (2022-06-20)
Kinnunen, Miika
M. Kinnunen
20.06.2022
© 2022 Miika Kinnunen. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202206203035
https://urn.fi/URN:NBN:fi:oulu-202206203035
Tiivistelmä
Tutkielman aiheena on verkkorakenteiden estimointimenetelmät. Työssä käsitellään verkkomallia, joka tunnetaan Gaussin graafisena mallina. Menetelmä, jonka avulla sen rakennetta voidaan estimoida tunnetaan nimellä graafinen lasso, joka pohjautuu lasso-menetelmään. Se mahdollistaa mallin estimoitujen parametrien visuaalisen esittämisen verkkokuvan avulla. Yhteydet tekijöiden välillä kuvataan osittaiskorrelaatioina. Aihe on ajankohtainen, koska sillä on käyttökohteita useilla aloilla, joista mainittakoon todennäköisyysteoria ja koneoppiminen.
Tutkimusaineisto koostuu ohran risteytysjälkeläisistä. Se sisältää fenotyyppitietoja, jotka ovat kukinnon alkaminen, viljasato, jyväpaino ja kasvuaika. Arvoja on mitattu kahden vuoden ajalta 17:sta maantieteellisessä paikassa.
Dataa käsiteltiin käyttämällä R-ohjelmistoa, joka annetun syötteen avulla pystyy estimoimaan aineiston verkkomallia. Tulosteena saadaan verkkokuva, jota analysoitaessa haluttiin tulkita visuaalisesti. Johtopäätöksiä oli tarkoitus tehdä tutkimalla fenotyyppejä. Haluttiin vertailla niihin vaikuttavia ominaisuuksia, kuten maantieteellistä sijaintia ja vuosien välisiä eroja.
Lähtökohtaisesti data olisi tarjonnut kattavan määrän aineistoa, mutta siinä usealla fenotyypillä esiintyi puuttuvia arvoja. Nämä poisjättämällä aineistosta tuli todennäköisesti liian suppea, koska siitä luotettavien johtopäätöksien tekeminen oli hankalaa. Aineisto oli kerätty ainoastaan kahden vuoden ajalta. Sen seurauksena vuosien välisien erojen tulkitseminen oli ongelmallista. Ideaalitilanteessa tietoja olisi voitu kerätä useammalta vuodelta. Osoittautui, että ilman kasvuun vaikuttavien ulkoistentekijöiden tuntemusta vain kahden vuoden datan tutkiminen ei tuonut mielekkäitä johtopäätöksiä.
Tutkimusaineisto koostuu ohran risteytysjälkeläisistä. Se sisältää fenotyyppitietoja, jotka ovat kukinnon alkaminen, viljasato, jyväpaino ja kasvuaika. Arvoja on mitattu kahden vuoden ajalta 17:sta maantieteellisessä paikassa.
Dataa käsiteltiin käyttämällä R-ohjelmistoa, joka annetun syötteen avulla pystyy estimoimaan aineiston verkkomallia. Tulosteena saadaan verkkokuva, jota analysoitaessa haluttiin tulkita visuaalisesti. Johtopäätöksiä oli tarkoitus tehdä tutkimalla fenotyyppejä. Haluttiin vertailla niihin vaikuttavia ominaisuuksia, kuten maantieteellistä sijaintia ja vuosien välisiä eroja.
Lähtökohtaisesti data olisi tarjonnut kattavan määrän aineistoa, mutta siinä usealla fenotyypillä esiintyi puuttuvia arvoja. Nämä poisjättämällä aineistosta tuli todennäköisesti liian suppea, koska siitä luotettavien johtopäätöksien tekeminen oli hankalaa. Aineisto oli kerätty ainoastaan kahden vuoden ajalta. Sen seurauksena vuosien välisien erojen tulkitseminen oli ongelmallista. Ideaalitilanteessa tietoja olisi voitu kerätä useammalta vuodelta. Osoittautui, että ilman kasvuun vaikuttavien ulkoistentekijöiden tuntemusta vain kahden vuoden datan tutkiminen ei tuonut mielekkäitä johtopäätöksiä.
Kokoelmat
- Avoin saatavuus [31657]