Phrase table pruning for Statistical Machine Translation

Näytä kaikki kuvailutiedot



Pysyväisosoite

http://hdl.handle.net/10138/15856
Julkaisun nimi: Phrase table pruning for Statistical Machine Translation
Tekijä: Galbrun, Esther
Päiväys: 2010-02-05
Kieli: en
Kuuluu julkaisusarjaan: Department of Computer Science Series of Publications C Report C-2009-22
URI: http://hdl.handle.net/10138/15856
Tiivistelmä: Phrase-Based Statistical Machine Translation systems model the translation process using pairs of corresponding sequences of words extracted from parallel corpora. These biphrases are stored in phrase tables that typically contain several millions such entries, making it di cult to assess their quality without going to the end of the translation process. Our work is based on the examplifying study of phrase tables generated from the Europarl data, from French to English. We give some statistical information about the biphrases contained in the phrase table, evaluate the coverage of previously unseen sentences and analyse the e ects of pruning on the translation.
Avainsanat: I.2.6 Learning
I.2.7 Natural Language Processing


Tiedostot

Latausmäärä yhteensä: Ladataan...

Tiedosto(t) Koko Formaatti Näytä
report(2).pdf 617.9KB PDF Avaa tiedosto

Viite kuuluu kokoelmiin:

Näytä kaikki kuvailutiedot