Variaatiot kaksitavuisten nominien taivutuksessa ja niiden mallintaminen inarinsaamen kielen morfologisessa analysaattorissa : e-, i-á,-, o- ja u-vartaloiset nominit
Brecciaroli, Fabrizio (2022-03-14)
Brecciaroli, Fabrizio
F. Brecciaroli
14.03.2022
© 2022 Fabrizio Brecciaroli. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202203141343
https://urn.fi/URN:NBN:fi:oulu-202203141343
Tiivistelmä
Taat tutkâmuš kuáská variaatioid 2-staavvâlsij nominij suujâtmist já toi myensteristmân anarâškielâ morfologisii analysaattorist. Anarâškielâ lii vala onnáá peeivi uccáá normâdum kielâ, mii taha máhđulâžžân maaŋgâi kuávlukielâ variaatioi tuhhiittem “olmâ kiellân”. Taat lii tiäđust-uv pyeri äšši kielâ rigesvuođâ peeleest, mut siämmást tot toovât meiddei uáli ennuv vädisvuođâid viereskielâ sárnoid, kiäh táválávt iä tuubdâ kuávlukielâ variaatioid. Taat pro gradu -tuuđhâlm čielgee motomijd variaatioid, moh tiättojeh 2-staavvâlsijn nominijn.
Anarâškielâ 2-staavvâlsiih nomineh juáhhojeh ohtsis oovce juávkun madduu mield: a, â, á, e, i, i-á, i-e-á, o já u. Taat jyehim kiävttoo meid taan tutkâmušâst, mii kieđâvuš e-, i-á-, o- já u-maadâsijd nominijd já addel iävtuttâs tast, maht toi variaatioid puáhtá myensteristiđ. Myensteristem várás mun čielgiim tom, magareh šlajânubástusah (ađai kvalitetnubástusah) já kukkodâhnubástusah (ađai kvantitetnubástusah) anarâškielâst láá sehe maht toh tuáimih. Mun lam juáhám taan tutkâmušâst kieđâvuššum juávhuid (e-, i-á-, o- já u-) vyelijuávhoid ton mield, magareh jienâdâhnubástusah tábáhtuveh madduu siste já magareh kukkodâhmeerhah tarbâšuvvojeh jienâdâhnubástusâi kuvviimân. Mun lam irâttâm kavnâđ systematia toos, kogo kalga merkkiđ kukkodâhmeerhâid já mondiet eidu toos. Mun lam irâttâm meiddei čielgiđ, mii mudoi tábáhtuvá säänist tien ohtâvuođâst já maht tom kalga máttááttiđ tiätumašinân. Keevâtlávt tááláš systeemhuksiittâs tiätumašinist meerrid tom, mon ennuv jotkâleksikoneh tarbâšuvvojeh já magareh toh láá. Jis ij lah máhđulâš myensteristiđ tiätu sänijuávhu kevttimnáál leijee jotkâleksikonijguin, te vistig kalga tutkâđ čuolmâ já kavnâđ suujâ toos já talle kalga rähtiđ tagarijd jotkâleksikonijd, moi vievâst puáhtá myensteristiđ áášánkullee sänijuávhu. Čuolmân lii táválávt tot, et kukkodâhmeerhah šaddeh puástusajan.
Stuárráámus tutkâmkoččâmuš lii tot, ete maht puáhtá huksiđ taggaar morfologisii analysaattor, mii västid tááláá kielâ tárboid, lii tuárvi älkkee rähtiđ já kevttiđ, lii lyetittettee (ađai tast iä lah ennuv feeilah) já mii siämmást taha älkken tivvoođ máhđulijd feeilâid. Taat koččâmuš lii pajanâm uáinusân majemui iivij eromâšávt anarâškielâ tááláá morfologisii analysaattor vädisvuođâi tiet.
Mun lam moonnâm čoođâ puoh 2-staavvâlsijd nominijd, moi maadân lii e, i-á, o tâi u. Mun lam tärhistâm, tiättojeh-uv tááláá kielâst kyehti paradigma vâi tuše ohtâ. Mun lam váldám huámmášumán tuše variaatioid, moi kiävttu tááláá kielâst lii tuhhiittum. Tastmaŋa mun lam analysistám tom, magarijn saanijn tiättojeh kyehti paradigma já magarijn saanijn tiättoo tuše ohtâ paradigma, já mun lam ráhtám njuolgâdusâid analyys puátusij vuáđuld. Ton lasseen mun lam kuvvim já myensteristám vuáđulávt, magareh jienâdâhnubástusah tiättojeh jieškote-uv paradigma ohtâvuođâst.
Taan tuđhâlmist kevttum paradigmah vuáđuduveh jieččân sujâttemtavlustuvváid. Iivij mield mun lam čokkim já sujâttâm puoh 2-staavvâlsijd nominijd, moh tááláá anarâškielâst láá. Suujâtmist mun lam kiävttám sänikirjeortografia. Talle ko mun lijjim epivises mottoom sujâttemhäämist, te mun koijâdim kielâmiäštárijn já eres-uv eenikielâlijn sárnoin. Nuubij sanijguin tavlustuvah láá vuáđuliih já sujâttemopâlávt olmânáál. Ton lasseen tain láá selvâttum puoh tábáhtusah, já kuávluliih variaatioh láá meid valdum huámmášumán. Tavlustuvâi vuáđuld puáhtá rähtiđ uđđâ analysaattor, mii siskeeld sänikirjeortografia. Tutkimukseni koskee variaatioita kaksitavuisten nominien taivutuksessa ja niiden mallintamista inarinsaamen kielen morfologisessa analysaattorissa. Inarinsaame on vielä nykyäänkin vain vähän normitettu kieli, mikä mahdollistaa useiden paikallisten variaatioiden hyväksymisen "oikeana kielenä". Tämä on hyvä asia kielen rikkaudelle, mutta samalla aiheuttaa paljon vaikeuksia niille, jotka puhuvat inarinsaamea vieraana kielenä, eivätkä tavallisesti tunne paikallisia variaatioita. Tämä pro gradu -tutkielma esittelee variaatioita, joita esiintyy kaksitavuisissa nomineissa.
Inarinsaamen kielen kaksitavuiset nominit jaetaan yhdeksään ryhmään vartalon mukaan: a, â, á, e, i, i-á, i-e-á, o ja u. Käytän tätä jakoa myös tässä tutkielmassa, jossa käsittelen e-, i-á-, o- ja u-vartaloisia nomineja ja annan ehdotuksen näiden variaatioiden mallinnukseen. Mallintamista varten esitän, minkälaisia laatumuutoksia (eli kvaliteettimuutoksia) ja pituusmuutoksia (eli kvantiteettimuutoksia) inarinsaamen kielessä esiintyy, sekä miten ne toimivat. Olen jakanut tässä tutkielmassa käsitellyt ryhmät (e, i-á, o ja u) alaryhmiin sen mukaan, minkälaisia äänteenmuutoksia sanan vartalon sisällä esiintyy ja minkälaisia pituusmerkkejä tarvitaan äänteenmuutosten kuvaamiseen. Olen luonut sääntöjä, mihin pituusmerkit pitää merkitä ja syyt niiden käytölle. Olen selittänyt, mitä sanassa tapahtuu näissä tapauksissa. Käytännössä nykyisellä järjestelmärakennelmalla tietokone määrittää sen, kuinka paljon jatkoleksikkoja tarvitaan ja minkälaisia ne ovat. Jos en pystynyt mallintamaan tiettyä sanaryhmää käytettävissä olevien jatkoleksikkojen avulla, tutkin ensin ongelmaa löytääkseni syyn siihen. Tämän jälkeen rakensin sellaisia jatkoleksikkoja, joiden avulla sanaryhmän mallintaminen onnistui. Esimerkki yleisestä ongelmasta oli se, että pituusmerkit olivat väärässä paikassa.
Suurin tutkimuskysymykseni on, miten voi rakentaa morfologisen analysaattorin, joka vastaa nykyisen kielen tarpeisiin. Analysaattorin tulisi olla riittävän helppo rakentaa ja käyttää. Sen pitäisi olla luotettava eli siinä ei tulisi olla virheitä ja siinä olevien virheiden tulisi olla helppo korjata. Tämä kysymys on tullut esiin viime aikoina inarinsaamenkielen nykyisen morfologisen analysaattorin ongelmien vuoksi.
Olen käynyt läpi kaikki kaksitavuiset nominit, joiden vartalo on e, i-á, o tai u. Olen tarkastanut, esiintyykö nykykielessä kaksi paradigmaa vai vain yksi. Olen ottanut huomioon vain variaatiot, joiden käyttö on hyväksytty nykykielessä. Tämän jälkeen olen analysoinut, minkälaisissa sanoissa esiintyy kaksi paradigmaa ja minkälaisissa sanoissa esiintyy vain yksi paradigma. Olen luonut sääntöjä analyysini tulosten perusteella. Sen lisäksi olen kuvannut ja mallintanut perusteellisesti, minkälaisia äänteenmuutoksia esiintyy jokaisen paradigman yhteydessä.
Tässä tutkielmassa käytetyt paradigmat perustuvat omiin taivutustaulukoihini. Vuosien varrella olen koonnut ja taivuttanut kaikki nykyisessä inarinsaamenkielessä esiintyvät kaksitavuiset nominit. Taivutuksessa olen käyttänyt pituusmerkkejä. Ollessani epävarma jostakin taivutusmuodosta olen kysynyt asiaa kielimestarilta ja muiltakin äidinkielisiltä puhujilta. Taulukot ovat siis perusteellisia ja taivutusopillisesti oikein. Olen lisäksi selittänyt kaikki tapaukset ja ottanut huomioon paikalliset variaatiot. Taulukoiden perusteella voi rakentaa uuden analysaattorin, joka sisältää pituusmerkit.
Anarâškielâ 2-staavvâlsiih nomineh juáhhojeh ohtsis oovce juávkun madduu mield: a, â, á, e, i, i-á, i-e-á, o já u. Taat jyehim kiävttoo meid taan tutkâmušâst, mii kieđâvuš e-, i-á-, o- já u-maadâsijd nominijd já addel iävtuttâs tast, maht toi variaatioid puáhtá myensteristiđ. Myensteristem várás mun čielgiim tom, magareh šlajânubástusah (ađai kvalitetnubástusah) já kukkodâhnubástusah (ađai kvantitetnubástusah) anarâškielâst láá sehe maht toh tuáimih. Mun lam juáhám taan tutkâmušâst kieđâvuššum juávhuid (e-, i-á-, o- já u-) vyelijuávhoid ton mield, magareh jienâdâhnubástusah tábáhtuveh madduu siste já magareh kukkodâhmeerhah tarbâšuvvojeh jienâdâhnubástusâi kuvviimân. Mun lam irâttâm kavnâđ systematia toos, kogo kalga merkkiđ kukkodâhmeerhâid já mondiet eidu toos. Mun lam irâttâm meiddei čielgiđ, mii mudoi tábáhtuvá säänist tien ohtâvuođâst já maht tom kalga máttááttiđ tiätumašinân. Keevâtlávt tááláš systeemhuksiittâs tiätumašinist meerrid tom, mon ennuv jotkâleksikoneh tarbâšuvvojeh já magareh toh láá. Jis ij lah máhđulâš myensteristiđ tiätu sänijuávhu kevttimnáál leijee jotkâleksikonijguin, te vistig kalga tutkâđ čuolmâ já kavnâđ suujâ toos já talle kalga rähtiđ tagarijd jotkâleksikonijd, moi vievâst puáhtá myensteristiđ áášánkullee sänijuávhu. Čuolmân lii táválávt tot, et kukkodâhmeerhah šaddeh puástusajan.
Stuárráámus tutkâmkoččâmuš lii tot, ete maht puáhtá huksiđ taggaar morfologisii analysaattor, mii västid tááláá kielâ tárboid, lii tuárvi älkkee rähtiđ já kevttiđ, lii lyetittettee (ađai tast iä lah ennuv feeilah) já mii siämmást taha älkken tivvoođ máhđulijd feeilâid. Taat koččâmuš lii pajanâm uáinusân majemui iivij eromâšávt anarâškielâ tááláá morfologisii analysaattor vädisvuođâi tiet.
Mun lam moonnâm čoođâ puoh 2-staavvâlsijd nominijd, moi maadân lii e, i-á, o tâi u. Mun lam tärhistâm, tiättojeh-uv tááláá kielâst kyehti paradigma vâi tuše ohtâ. Mun lam váldám huámmášumán tuše variaatioid, moi kiävttu tááláá kielâst lii tuhhiittum. Tastmaŋa mun lam analysistám tom, magarijn saanijn tiättojeh kyehti paradigma já magarijn saanijn tiättoo tuše ohtâ paradigma, já mun lam ráhtám njuolgâdusâid analyys puátusij vuáđuld. Ton lasseen mun lam kuvvim já myensteristám vuáđulávt, magareh jienâdâhnubástusah tiättojeh jieškote-uv paradigma ohtâvuođâst.
Taan tuđhâlmist kevttum paradigmah vuáđuduveh jieččân sujâttemtavlustuvváid. Iivij mield mun lam čokkim já sujâttâm puoh 2-staavvâlsijd nominijd, moh tááláá anarâškielâst láá. Suujâtmist mun lam kiävttám sänikirjeortografia. Talle ko mun lijjim epivises mottoom sujâttemhäämist, te mun koijâdim kielâmiäštárijn já eres-uv eenikielâlijn sárnoin. Nuubij sanijguin tavlustuvah láá vuáđuliih já sujâttemopâlávt olmânáál. Ton lasseen tain láá selvâttum puoh tábáhtusah, já kuávluliih variaatioh láá meid valdum huámmášumán. Tavlustuvâi vuáđuld puáhtá rähtiđ uđđâ analysaattor, mii siskeeld sänikirjeortografia.
Inarinsaamen kielen kaksitavuiset nominit jaetaan yhdeksään ryhmään vartalon mukaan: a, â, á, e, i, i-á, i-e-á, o ja u. Käytän tätä jakoa myös tässä tutkielmassa, jossa käsittelen e-, i-á-, o- ja u-vartaloisia nomineja ja annan ehdotuksen näiden variaatioiden mallinnukseen. Mallintamista varten esitän, minkälaisia laatumuutoksia (eli kvaliteettimuutoksia) ja pituusmuutoksia (eli kvantiteettimuutoksia) inarinsaamen kielessä esiintyy, sekä miten ne toimivat. Olen jakanut tässä tutkielmassa käsitellyt ryhmät (e, i-á, o ja u) alaryhmiin sen mukaan, minkälaisia äänteenmuutoksia sanan vartalon sisällä esiintyy ja minkälaisia pituusmerkkejä tarvitaan äänteenmuutosten kuvaamiseen. Olen luonut sääntöjä, mihin pituusmerkit pitää merkitä ja syyt niiden käytölle. Olen selittänyt, mitä sanassa tapahtuu näissä tapauksissa. Käytännössä nykyisellä järjestelmärakennelmalla tietokone määrittää sen, kuinka paljon jatkoleksikkoja tarvitaan ja minkälaisia ne ovat. Jos en pystynyt mallintamaan tiettyä sanaryhmää käytettävissä olevien jatkoleksikkojen avulla, tutkin ensin ongelmaa löytääkseni syyn siihen. Tämän jälkeen rakensin sellaisia jatkoleksikkoja, joiden avulla sanaryhmän mallintaminen onnistui. Esimerkki yleisestä ongelmasta oli se, että pituusmerkit olivat väärässä paikassa.
Suurin tutkimuskysymykseni on, miten voi rakentaa morfologisen analysaattorin, joka vastaa nykyisen kielen tarpeisiin. Analysaattorin tulisi olla riittävän helppo rakentaa ja käyttää. Sen pitäisi olla luotettava eli siinä ei tulisi olla virheitä ja siinä olevien virheiden tulisi olla helppo korjata. Tämä kysymys on tullut esiin viime aikoina inarinsaamenkielen nykyisen morfologisen analysaattorin ongelmien vuoksi.
Olen käynyt läpi kaikki kaksitavuiset nominit, joiden vartalo on e, i-á, o tai u. Olen tarkastanut, esiintyykö nykykielessä kaksi paradigmaa vai vain yksi. Olen ottanut huomioon vain variaatiot, joiden käyttö on hyväksytty nykykielessä. Tämän jälkeen olen analysoinut, minkälaisissa sanoissa esiintyy kaksi paradigmaa ja minkälaisissa sanoissa esiintyy vain yksi paradigma. Olen luonut sääntöjä analyysini tulosten perusteella. Sen lisäksi olen kuvannut ja mallintanut perusteellisesti, minkälaisia äänteenmuutoksia esiintyy jokaisen paradigman yhteydessä.
Tässä tutkielmassa käytetyt paradigmat perustuvat omiin taivutustaulukoihini. Vuosien varrella olen koonnut ja taivuttanut kaikki nykyisessä inarinsaamenkielessä esiintyvät kaksitavuiset nominit. Taivutuksessa olen käyttänyt pituusmerkkejä. Ollessani epävarma jostakin taivutusmuodosta olen kysynyt asiaa kielimestarilta ja muiltakin äidinkielisiltä puhujilta. Taulukot ovat siis perusteellisia ja taivutusopillisesti oikein. Olen lisäksi selittänyt kaikki tapaukset ja ottanut huomioon paikalliset variaatiot. Taulukoiden perusteella voi rakentaa uuden analysaattorin, joka sisältää pituusmerkit.
Kokoelmat
- Avoin saatavuus [31652]