The use of neural machine translation in translating Finnish news articles : an error analysis of the NMT service DeepL
Lindvall, Samu (2022-06-21)
Lindvall, Samu
S. Lindvall
21.06.2022
© 2022 Samu Lindvall. Tämä Kohde on tekijänoikeuden ja/tai lähioikeuksien suojaama. Voit käyttää Kohdetta käyttöösi sovellettavan tekijänoikeutta ja lähioikeuksia koskevan lainsäädännön sallimilla tavoilla. Muunlaista käyttöä varten tarvitset oikeudenhaltijoiden luvan.
Julkaisun pysyvä osoite on
https://urn.fi/URN:NBN:fi:oulu-202206213093
https://urn.fi/URN:NBN:fi:oulu-202206213093
Tiivistelmä
In this thesis, a brief overview of the functionality of the neural machine translation system DeepL is provided. Machine translation is an expanding field in translation studies, and it continuously provides us with new technology and applications to translate texts as accurately as possible. The aim of this study was to examine the capabilities of DeepL in translating Finnish news articles with no available reference translations. The reason for this was to prevent DeepL from finding completed translations and possibly benefitting from them, as neural machine translation systems seek data from sources available on the internet. The articles were selected randomly from the free internet news providers Yle and Iltalehti. The errors have been listed, categorized and analyzed in the section “Analysis”. Conclusions along with general discussion about the performance of DeepL can be found in the last section of this thesis. Overall, this thesis shows DeepL’s promising capability when translating news text. Still, it must be kept in mind that the aim of this thesis was not to seek perfect translations, but rather successful message transmission. The idea of machine translation being a worthy competitor to human-made translations in more specific areas of translation, such as medical or legal translation, is still far away. Still, any conducted research is vital for the progression and development of machine translation services. The analysis of this study provides examples of areas where DeepL is not sufficient. These areas include for example, the translation of new words, translation of pronouns and culture-specific terms. Instances when DeepL succeeds to make acceptable translations in one of the listed categories, have been presented also in the analysis section. Kandidaatintyössäni käsitellään neuroverkkoihin perustuvan käännösohjelman, DeepL:n suoriutumista käännettäessä suomalaisia uutistekstejä. Käytettävät tekstit on poimittu Ylen ja Iltalehden ilmaisista nettiuutispalveluista. Työssä käytettyjä uutistekstejä ei ole käännetty englannin kielelle. Tämä oletettavasti välttää konekääntöohjelmien hyötymisen valmiista käännöksistä, joka on tärkeää ottaen huomioon neuroverkkoihin perustuvien kääntämisohjelmien toimintaperusteet. Konekääntäminen on aiheena trendikäs, ja kuuluu nykypäivänä sovellusten myötä osaksi lähes jokaisen elämää. Alan kehittymisen voi selvästi havaita tarkkailemalla koko ajan uudistuvia konekääntöohjelmia. Käännetyistä teksteistä havaitut virheet on analysoitu virheanalyysin muodossa, ja johtopäätökset esitetty tutkielman lopussa. Virheanalyysi on jaettu kategorioihin virhetyyppien perusteella. Yleisellä tasolla voinee todeta, että DeepL suoriutuu hyvin käännettäessä suomalaista uutistekstiä. Tämän tutkimuksen tavoitteena ei kuitenkaan ollut etsiä täydellistä kääntämistä, vaan onnistunutta viestinvälitystä. Eri kääntämisen alat, kuten lääketieteellinen kääntäminen ja lakitekstikääntäminen vaativat äärimmäistä tarkkuutta, ja tässä työssä esitettävien virhe-esimerkkien perusteella voinee todeta, että konekääntäminen ei vielä sovellu vaikkapa edellä mainittujen alojen tekstien kääntämiseen. Konekääntäminen on joka tapauksessa toimiva apuväline jokapäiväisiin kieleen liittyviin ongelmiin, ja sen tutkiminen on tärkeää sen kehittämiselle. Analyysini antaa pintaraapaisun siitä, missä DeepL:n kaltaiset konekääntöohjelmat eivät vielä suoriudu. Virheitä löytyi esimerkiksi pronominien käytössä, kulttuurille omien termien käännöksessä ja uudissanojen kääntämisessä. Analyysissä on esitelty myös esimerkkejä tapauksista, joissa DeepL suoriutuu kääntämään tiettyyn kategoriaan liittyvän tekstin osan onnistuneesti.
Kokoelmat
- Avoin saatavuus [31657]