Kuolleisuuden mallintaminen ja ennustaminen stokastisten kuolleisuusmallien avulla
Juutinen, Aapo (2022-04-20)
Juutinen, Aapo
A. Juutinen
20.04.2022
© 2022 Aapo Juutinen. Ellei toisin mainita, uudelleenkäyttö on sallittu Creative Commons Attribution 4.0 International (CC-BY 4.0) -lisenssillä (https://creativecommons.org/licenses/by/4.0/). Uudelleenkäyttö on sallittua edellyttäen, että lähde mainitaan asianmukaisesti ja mahdolliset muutokset merkitään. Sellaisten osien käyttö tai jäljentäminen, jotka eivät ole tekijän tai tekijöiden omaisuutta, saattaa edellyttää lupaa suoraan asianomaisilta oikeudenhaltijoilta.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202204201608
https://urn.fi/URN:NBN:fi:oulu-202204201608
Tiivistelmä
Tämän tutkielman tavoitteena on mallintaa ja ennustaa kuolleisuutta Suomessa kahden eri stokastisen kuolleisuusmallin, Lee-Carterin mallin sekä Renshaw-Habermanin mallin avulla. Tutkielman teoriaosassa esitetään suomenkielinen katsaus stokastisiin kuolleisuusmalleihin ja empiirisessä osassa tarkastellaan mallien käytännön sopivuutta suomalaiseen väestöaineistoon. Tutkielman keskeisinä empiirisinä tutkimuskysymyksinä ovat: kuinka hyvin esitetyt kuolleisuusmallit sopivat suomalaiseen väestöaineistoon ja minkälaisia ennusteita mallien pohjalta saadaan kuolleisuutta koskien?
Tutkielman aineistona käytetään Human Mortality Databasen (2014) aineistoa, joka kattaa kuolleisuus- ja väestötietoja useista eri maista. Tässä tutkielmassa käytetään kuolleisuus- ja väestötietoja pelkästään Suomen osalta, jotka kattavat vuodet 1887–2018 ja ikävuodet 0–110 sekä koko väestön tasolla että sukupuolittain.
Mallien jäännöstermien perusteella, Lee-Carterin malli ei täysin onnistu huomioimaan iän, kalenterivuoden ja syntymävuoden vaikutusta. Erityisesti ongelmallinen on syntymävuoden vaikutus. Renshaw-Habermanin malli onnistuu Lee-Carterin mallia paremmin huomioimaan eri selittävien tekijöiden vaikutukset. Myös informaatiokriteereitä vertailtaessa Renshaw-Habermanin malli näyttäisi sopivan aineistoon selvästi Lee-Carterin mallia paremmin. Ennustettaessa kuolleisuutta Lee-Carterin mallin pohjalta simuloiduissa ennusteissa oli huomattavasti vähemmän hajontaa kuin Renshaw-Habermanin mallin pohjalta simuloiduissa ennusteissa. Renshaw-Habermanin mallin pohjalta laskettava ennusteväli kuolleisuudelle kasvoi selvästi, mitä vanhempi henkilö oli kyseessä.
Tutkielman tulosten perusteella Renshaw-Habermanin malli sopii paremmin suomalaisen kuolleisuuden mallintamiseen ja ennustamiseen. On kuitenkin huomioitava, että tässä tutkielmassa vertailtiin vain kahta erilaista mallia. Käytännön sovelluksissa on suositeltavaa vertailla useampia eri malleja keskenään, jotta varmasti päädytään aineistoon parhaiten sopivaan malliin.
Tutkielman aineistona käytetään Human Mortality Databasen (2014) aineistoa, joka kattaa kuolleisuus- ja väestötietoja useista eri maista. Tässä tutkielmassa käytetään kuolleisuus- ja väestötietoja pelkästään Suomen osalta, jotka kattavat vuodet 1887–2018 ja ikävuodet 0–110 sekä koko väestön tasolla että sukupuolittain.
Mallien jäännöstermien perusteella, Lee-Carterin malli ei täysin onnistu huomioimaan iän, kalenterivuoden ja syntymävuoden vaikutusta. Erityisesti ongelmallinen on syntymävuoden vaikutus. Renshaw-Habermanin malli onnistuu Lee-Carterin mallia paremmin huomioimaan eri selittävien tekijöiden vaikutukset. Myös informaatiokriteereitä vertailtaessa Renshaw-Habermanin malli näyttäisi sopivan aineistoon selvästi Lee-Carterin mallia paremmin. Ennustettaessa kuolleisuutta Lee-Carterin mallin pohjalta simuloiduissa ennusteissa oli huomattavasti vähemmän hajontaa kuin Renshaw-Habermanin mallin pohjalta simuloiduissa ennusteissa. Renshaw-Habermanin mallin pohjalta laskettava ennusteväli kuolleisuudelle kasvoi selvästi, mitä vanhempi henkilö oli kyseessä.
Tutkielman tulosten perusteella Renshaw-Habermanin malli sopii paremmin suomalaisen kuolleisuuden mallintamiseen ja ennustamiseen. On kuitenkin huomioitava, että tässä tutkielmassa vertailtiin vain kahta erilaista mallia. Käytännön sovelluksissa on suositeltavaa vertailla useampia eri malleja keskenään, jotta varmasti päädytään aineistoon parhaiten sopivaan malliin.
Kokoelmat
- Avoin saatavuus [31657]