Tunnetilojen tunnistaminen tekstistä esikoulutetuilla koneoppimismalleilla

Show full item record



Permalink

http://urn.fi/URN:NBN:fi:hulib-202008173799
Title: Tunnetilojen tunnistaminen tekstistä esikoulutetuilla koneoppimismalleilla
Author: Yli-luukko, Maria
Contributor: University of Helsinki, Faculty of Science
Publisher: Helsingin yliopisto
Date: 2020
Language: fin
URI: http://urn.fi/URN:NBN:fi:hulib-202008173799
http://hdl.handle.net/10138/318356
Thesis level: master's thesis
Discipline: Matematiikka
Abstract: Sentimenttianalyysi on yksi tutkituimpia luonnollisen kielen käsittelyn linjoja, jonka modernimpeihin työkaluihin kuuluu neuroverkot. Alan alle on syntynyt haastavampi luokittelutehtävä, jonka tavoitteena on perinteisen positiivisen, neutraalin ja negatiivisen arvion lisäksi tunnistaa tekstistä tunnetiloja, kuten surua, iloa tai vihaa ja rakkautta. Siinä missä sentimenttianalyysin polaarisuuden tutkimuksessa etsitään vain kolmea luokkaa, tunnetiloja on useimpien teorioiden mukaan olemassa yli kuutta erilaista, mikä kasvattaa eri ratkaisujen määrää eksponentiaalisesti, ja tekee moniluokittelutehtävästä haastavamman. Tutkimusongelma on kiinnostava, sillä automaattisilla algoritmeilla pystytään käsittelemään valtavia määriä tekstiä vain muutamissa sekunneissa, ja luomaan lopputuloksena tiivistelmiä, jotka kertovat, millaisista asioista tekstissä puhutaan. Tällaiset työkalut ovat hyödyllisiä esimerkiksi yrittäjille, joiden halu on ymmärtää omia ja tulevia asiakkaitaan paremmin. Ihmiset tuottavat paljon tekstiä päivittäin sosiaalisen median kautta, ja toisinaan antavat palautetta myös suoraan yrityksille; jos nämä eri lähteet pystytään tiivistämään helposti ymmärrettäviksi kuvaajiksi ja luvuiksi, saadaan tärkeää tietoa siitä, millaiset tarpeet ohjaavat ihmisten ostokäyttäytymistä. Tutkielmassa tutustutaan neuroverkkoihin ja tilastollisiin menetelmiin, joilla tunteita voidaan havaita tekstistä automaattisesti. Soveltavassa osiossa luodaan muutaman aikansa tuloksellisemman koneoppimisarkkitehtuurin avulla malli, jonka opetusaineistona käytetään vuoden 2018 SemEval-tehtävän 10 tuhatta käsinluokiteltua Twitterjulkaisua. Tavoitteena on kuvata mallinnusprosessi ja siihen liittyvät oletukset ja lopuksi näyttää, että prosessilla saatavien mallien ennustustarkkuus on hyvä, ja lisäksi osoittaa, että esikoulutettujen koneoppimismallien ennustustarkkuus on sanapohjaisia malleja parempi. Lopputuloksena saadaan uutta BERT-arkkitehtuuria käyttävä malli, joka saavuttaa vuoden 2018 SemEval -tehtävän muiden kilpailevien mallien suoritustason.
Subject: Luonnollisen kielen käsittely
Sentimenttianalyysi
Emootioteoria
Mallintaminen
Neuroverkot


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record