Browsing by Subject "apprentissage automatique"

Sort by: Order: Results:

Now showing items 1-1 of 1
  • Poutanen, Julia (Helsingin yliopisto, 2018)
    Tämän tutkielman tarkoituksena on tutkia aikuisten ja nuorten kielenkäytön välisiä eroja ranskankielisessä tekstiviestiaineistossa. Eroja tutkitaan luomalla koneoppimista hyödyntävä automaattinen luokittelija, joka kykenee erottelemaan aikuisten ja nuorten tekstiviestit toisistaan. Työssä tarkastellaan luokittelijan antamia tuloksia ja pyritään selvittämään, miten luokittelijan toimintaa voidaan parantaa kielenkäytöstä saatujen tietojen valossa esimerkiksi tutkielmassa määritellyillä piirteillä (engl. feature). Teoriaosassa käsitellään tekstiviestikielen piirteiden lisäksi iän ja kielenkäytön välistä suhdetta sekä kieliteknologialle ja korpuslingvistiikalle tärkeitä käsitteitä. Menetelmänä käytetystä tilastollisesta luokittelijasta esitellään siihen liittyvä olennainen teoria sekä muita tutkielman kannalta tärkeitä käsitteitä. Tutkielman aineisto on kerätty Montpellier’ssä, Ranskassa vuonna 2011, ja se koostuu silloiseen tutkimukseen osallistuneiden lähettämistä tekstiviesteistä. Tekstiviestejä on yhteensä 88 000, ja niistä noin 70 000 käytetään tutkielmassa. Analyysissä keskitytään sekä kielellisiin että teknisiin piirteisiin: tarkastelun kohteina ovat täten sekä malli että aineiston kielelliset piirteet. Tutkimustuloksista selviää, että luokittelija toimii varsin hyvin tekstiviestien erottelussa, mutta tutkielmassa erikseen määritellyt piirteet eivät paranna merkittävästi luokittelijan toimintaa. Piirteistä voidaan kuitenkin tehdä joitakin johtopäätöksiä: tekstiviesteille on tyypillistä keskustelunomainen kielenkäyttö viestin lähettäjän ja vastaanottajan välillä sekä puhekieli. Analysoitujen viestien perusteella voidaan nähdä, että tekstiviestikielen ominaispiirteisiin kuuluvat ääntämistä ja foneettista muotoa heijastavat sanamuodot ja että tekstiviesti muodostanee oman rekisterinsä ranskan kielessä.