En jämförelse av maskinöversättningsprogrammen Sunda Translator och Google Translate : En syntaktisk, semantisk och pragmatisk analys av feltyper i tre texter

Show full item recordPermalink

http://urn.fi/URN:NBN:fi:hulib-201605111646
Title: En jämförelse av maskinöversättningsprogrammen Sunda Translator och Google Translate : En syntaktisk, semantisk och pragmatisk analys av feltyper i tre texter
Author: Lind, Marjukka
Other contributor: Helsingin yliopisto, Humanistinen tiedekunta, Suomen kielen, suomalais-ugrilaisten ja pohjoismaisten kielten ja kirjallisuuksien laitos
University of Helsinki, Faculty of Arts, Department of Finnish, Finno-Ugrian and Scandinavian Studies
Helsingfors universitet, Humanistiska fakulteten, Finska, finskugriska och nordiska institutionen
Publisher: Helsingfors universitet
Date: 2016
Language: swe
URI: http://urn.fi/URN:NBN:fi:hulib-201605111646
http://hdl.handle.net/10138/161839
Thesis level: master's thesis
Discipline: Translation of Swedish
Ruotsin kääntäminen
Svensk översättning
Abstract: Pro gradu -tutkielmani käsittelee konekääntämistä yleisesti ja erityisesti kahta konekäännösohjelmaa. Vertailen tutkielmassani sääntöpohjaisen Sunda Translator- sekä tilastollisen Google Translate -konekäännösohjelman englanti–suomi-käännöksiä virheanalyysin avulla. Vertailun vuoksi käännätän yhden tekstin Google Translate -konekäännösohjelmalla ruotsin kielelle, jotta voidaan tarkastella käännöslaadun eroja suomen ja ruotsin välillä. Pohdin myös, miten käyttökelpoisia aiemmin mainitut konekäännösohjelmat voisivat olla kääntäjän työssä. Virheanalyysissä tutkin syntaktisia virheitä, joita ovat väärä verbimuoto, väärä sijamuoto, väärä sanajärjestys, väärä välimerkkien käyttö, sanojen yhteen tai erikseen kirjoittaminen sekä kirjoitusvirheet. Lisäksi tutkin myös leksikaalisia ja semanttisia virheitä, joita ovat väärin käännetyt sanat, lähtökielelle jätetyt sanat, sanojen väärä merkitys kontekstissa (joka johtuu sanojen monimerkityksellisyydestä), virheet vakiintuneissa ilmauksissa, väärän termin valinta sekä kääntämättä jätetyt sanat. Käytän tutkielmassani kvalitatiivista ja komparatiivista menetelmää. Myös kvantitatiivista menetelmää käytetään analyysin virheiden määrää laskettaessa. Tutkimusmateriaali koostuu kolmesta eri tekstityypistä: teknisestä [Tuotenimi] Multimedia storage viewer -tekstistä, Violent and threatening behaviour -asiatekstistä sekä kuvailevasta Viva La Juicy Rosé markkinointitekstistä. Tekstien yhteenlaskettu sanamäärä on 714 sanaa. Havainnollistan eri virhetyyppien toteutumista esittämällä esimerkkejä teksteistä ja analysoimalla niitä. Tutkimukseni osoittaa, että Google Translate tekee selkeästi enemmän virheitä syntaktisella, leksikaalisella ja semanttisella tasolla kuin Sunda Translator, kun otetaan huomioon kaikki virhetyypit. Google Translate -ohjelmalle virheitä kertyy 205, kun taas Sunda Translator selviää 135 virheellä. Tutkielmasta ilmenee, että molemmat konekäännösohjelmat soveltuvat yllä mainitun teknisen tekstin ja asiatekstin kääntämiseen sellaiselle tasolle, että lukija ymmärtää sisällön. Julkaisukelpoisen tekstin saavuttamiseksi tarvitaan kuitenkin ihmiskääntäjän suorittama jälkieditointi. Yllä mainitun markkinointitekstin kääntämiseen ohjelmat eivät sovellu, koska teksti sisältää kuvailevaa kieltä, vaikeita lauserakenteita sekä tuotenimiä. Tällaisen tekstin kääntämiseen tarvitaan ihmiskääntäjän kielellistä intuitiota sekä kykyä sisäistää asiakokonaisuuksia.
Subject: machine translation (MT)
konekääntäminen
sääntöpohjainen konekääntäminen
tilastollinen konekääntäminen
virheanalyysi
syntaktinen virhe
leksikaalinen virhe
semanttinen virhe
pragmaattinen virhe


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record