Machine Translation Post-editing and Effort : Empirical Studies on the Post-editing Process

Show full item recordPermalink

http://urn.fi/URN:ISBN:978-951-51-1975-9
Title: Machine Translation Post-editing and Effort : Empirical Studies on the Post-editing Process
Author: Koponen, Maarit
Contributor organization: University of Helsinki, Faculty of Arts, Department of Modern Languages
Helsingin yliopisto, humanistinen tiedekunta, nykykielten laitos
Helsingfors universitet, humanistiska fakulteten, institutionen för moderna språk
Publisher: Helsingin yliopisto
Date: 2016-03-19
Language: eng
URI: http://urn.fi/URN:ISBN:978-951-51-1975-9
http://hdl.handle.net/10138/160256
Thesis level: Doctoral dissertation (article-based)
Abstract: This dissertation investigates the practice of machine translation post-editing and the various aspects of effort involved in post-editing work. Through analyses of edits made by post-editors, the work described here examines three main questions: 1) what types of machine translation errors or source text features cause particular effort in post-editing, 2) what types of errors can or cannot be corrected without the help of the source text, and 3) how different indicators of effort vary between different post-editors. The dissertation consists of six previously published articles, and an introductory summary. Five of the articles report original research, and involve analyses of post-editing data to examine questions related to post-editing effort as well as differences between post-editors. The sixth article is a survey presenting an overview of the research literature. The research reported is based on multiple datasets consisting of machine translations and their post-edited versions, as well as process and evaluation data related to post-editing effort. The dissertation presents a mixed methods study combining qualitative and quantitative approaches, as well as theoretical and analytical tools from the fields of language technology and translation studies. Data on edits performed by post-editors, post-editing time, keylogging data, and subjective evaluations of effort are combined with error analyses of the machine translations in question, and compared for various post-editors. The results of this dissertation provide evidence that, in addition to the number of edits performed, post-editing effort is affected by the type of edits as well as source text features. Secondly, the results show that while certain language errors can be corrected even without access to the source text, certain other types that more severely affect the meaning cannot. Thirdly, the results show that post-editors' speed and the amount of editing they perform differ, and that various profiles can be identified in terms of how the edits are planned and carried out by the post-editors. The results of this work may have both theoretical and practical implications for the measurement and estimation of post-editing effort.Väitöskirjani tutkimuskohteena on konekäännösten jälkieditointi ja editoinnin työläys. Konekäännöksen jälkieditoinnilla tarkoitetaan, että kääntimellä tuotetaan raakakäännös, jota kääntäjä muokkaa. Tällainen konekäännösten käyttö on viime vuosina yleistynyt, joskin Suomessa se on vielä vähäistä. Raakakäännöksen käytöstä on hyötyä käännösprosessissa vain, jos jälkieditointi on vähemmän työlästä kuin kääntäminen ilman raakakäännöstä. Siksi tarvitaan tietoa, miten konekäännöksen virheet vaikuttavat editointiin, milloin editointi on mielekästä ja milloin virheet tekevät raakakäännöksen käytön liian työlääksi. Tutkimuksessa tarkastelen editoijien tekemiä muutoksia ja analysoin, millaiset konekäännöksissä esiintyvät virheet tai lähtötekstien piirteet tekevät editoinnista erityisen työlästä. Tutkin, onnistuuko virheiden korjaaminen joissakin tilanteissa jopa ilman lähtötekstiä. Tarkastelen myös, miten työläys näkyy eri editoijien tekemien korjausten määrässä, editointinopeudessa ja editointitavoissa. Analyysi pohjautuu englanti-suomi- ja englanti-espanja-konekäännöksiin ja niiden jälkieditoituihin versioihin. Editoijien tekemien muutosten perusteella analysoin, millaisia virheitä he konekäännöksestä korjasivat ja millaisia virheitä ei pystytty korjaamaan, jos lähtötekstiä ei ollut käytettävissä. Virheanalyysiin yhdistin aineistoa editointiin kuluneesta ajasta ja tietokoneen näppäimistön käytöstä editoinnin aikana, sekä konekäännöstä arvioineiden henkilöiden subjektiivisia arvioita, kuinka työlääksi editointi koettiin. Analyysi yhdistää sekä laadullisia että määrällisiä menetelmiä. Tutkimuksen tulokset osoittavat, että konekäännökseen tehtyjen muutosten lukumäärän lisäksi myös muut tekijät, kuten virheiden tyyppi ja editoitavan virkkeen pituus, vaikuttavat sekä editointiaikaan että subjektiivisesti koettuun työläyteen. Tulokset myös viittaavat siihen, että tietyntyyppisten kielellisten virheiden korjaaminen onnistuu jopa ilman lähtötekstiä mutta vakavammin merkityksen välittymistä haittaavat virheet voivat tehdä korjaamisesta mahdotonta. Eri editoijien prosessien vertailu osoittaa myös, että editointinopeus ja korjausten määrä vaihtelee samaakin tekstiä editoitaessa, ja eri editoijat toteuttavat korjauksensa eri tavoin. Tutkimuksen tuloksia voidaan hyödyntää sekä konekääntimien että editointiprosessien kehittämisessä ja editoinnin työläyden arvioinnissa.
Subject: kieliteknologia
käännöstiede
Rights: Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty.


Files in this item

Total number of downloads: Loading...

Files Size Format View
machinet.pdf 416.5Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record