Analysing concatenation approaches to document-level NMT in two different domains

Näytä kaikki kuvailutiedot



Pysyväisosoite

http://hdl.handle.net/10138/306876

Lähdeviite

Scherrer , Y , Tiedemann , J & Loáiciga , S 2019 , Analysing concatenation approaches to document-level NMT in two different domains . in The Fourth Workshop on Discourse in Machine Translation : Proceedings of the Workshop . The Association for Computational Linguistics , Stroudsburg , pp. 51-61 , Workshop on Discourse in Machine Translation , Hong Kong , China , 03/11/2019 . https://doi.org/10.18653/v1/D19-6506

Julkaisun nimi: Analysing concatenation approaches to document-level NMT in two different domains
Tekijä: Scherrer, Yves; Tiedemann, Jörg; Loáiciga, Sharid
Tekijän organisaatio: Department of Digital Humanities
Language Technology
Mind and Matter
Julkaisija: The Association for Computational Linguistics
Päiväys: 2019-11-01
Kieli: eng
Sivumäärä: 11
Kuuluu julkaisusarjaan: The Fourth Workshop on Discourse in Machine Translation
ISBN: 978-1-950737-74-1
DOI-tunniste: https://doi.org/10.18653/v1/D19-6506
URI: http://hdl.handle.net/10138/306876
Tiivistelmä: In this paper, we investigate how different aspects of discourse context affect the performance of recent neural MT systems. We describe two popular datasets covering news and movie subtitles and we provide a thorough analysis of the distribution of various document-level features in their domains. Furthermore, we train a set of context-aware MT models on both datasets and propose a comparative evaluation scheme that contrasts coherent context with artificially scrambled documents and absent context, arguing that the impact of discourse-aware MT models will become visible in this way. Our results show that the models are indeed affected by the manipulation of the test data, providing a different view on document-level translation quality than absolute sentence-level scores.
Avainsanat: 113 Computer and information sciences
6121 Languages
Vertaisarvioitu: Kyllä
Tekijänoikeustiedot: cc_by
Pääsyrajoitteet: openAccess
Rinnakkaistallennettu versio: publishedVersion
Rahoittaja: European Commission / Horizon 2020
European Research Council (ERC)
Rahoitusnumero:
771113


Tiedostot

Latausmäärä yhteensä: Ladataan...

Tiedosto(t) Koko Formaatti Näytä
D19_6506.pdf 259.2KB PDF Avaa tiedosto

Viite kuuluu kokoelmiin:

Näytä kaikki kuvailutiedot