Classification automatique des SMS : analyse des caractéristiques langagières de deux groupes d’âge

Show simple item record

dc.contributor Helsingin yliopisto, Humanistinen tiedekunta, Nykykielten laitos fi
dc.contributor University of Helsinki, Faculty of Arts, Department of Modern Languages en
dc.contributor Helsingfors universitet, Humanistiska fakulteten, Institutionen för moderna språk sv
dc.contributor.author Poutanen, Julia
dc.date.issued 2018
dc.identifier.uri URN:NBN:fi:hulib-201806132530
dc.identifier.uri http://hdl.handle.net/10138/236112
dc.description.abstract Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä. fi
dc.language.iso fre
dc.publisher Helsingin yliopisto fi
dc.publisher University of Helsinki en
dc.publisher Helsingfors universitet sv
dc.subject apprentissage automatique fr
dc.subject âge fr
dc.subject langue française fr
dc.subject linguistique informatique fr
dc.subject SMS en
dc.subject tekstiviestit fi
dc.subject koneoppiminen fi
dc.subject ikä fi
dc.subject luokittelu fi
dc.subject ranskan kieli fi
dc.subject kieliteknologia fi
dc.title Classification automatique des SMS : analyse des caractéristiques langagières de deux groupes d’âge fr
dc.type.ontasot pro gradu -tutkielmat fi
dc.type.ontasot master's thesis en
dc.type.ontasot pro gradu-avhandlingar sv
dc.subject.discipline ranskalainen filologia fi
dc.subject.discipline French Philology en
dc.subject.discipline Fransk filologi sv
dct.identifier.urn URN:NBN:fi:hulib-201806132530

Files in this item

Total number of downloads: Loading...

Files Size Format View
Poutanen_Julia_Progradu_2018.pdf 634.3Kb PDF View/Open

This item appears in the following Collection(s)

Show simple item record