The Language of Emotions : Building and Applying Computational Methods for Emotion Detection for English and Beyond

Show simple item record

dc.contributor Helsingin yliopisto, humanistinen tiedekunta fi
dc.contributor Helsingfors universitet, humanistiska fakulteten sv
dc.contributor University of Helsinki, Faculty of Arts, Department of Digital Humanities en
dc.contributor Kielentutkimuksen tohtoriohjelma fi
dc.contributor Doktorandprogrammet i språkforskning sv
dc.contributor Doctoral Programme in Language Studies en
dc.contributor.author Öhman, Emily
dc.date.accessioned 2021-01-28T06:51:46Z
dc.date.available 2021-02-23
dc.date.available 2021-01-28T06:51:46Z
dc.date.issued 2021-03-05
dc.identifier.uri URN:ISBN:978-951-51-7106-1
dc.identifier.uri http://hdl.handle.net/10138/325351
dc.description.abstract Emotions have always been central to the human experience: the ancient Greeks had philosophical debates about the nature of emotions and Charles Darwin can be said to have founded the modern theories of emotions with his study "The expression of the emotions in man and animals". Theories of emotion are still actively researched in many different fields from psychology, cognitive science, and anthropology to computer science. Sentiment analysis usually refers to the use of computational tools to identify and extract sentiments and emotions from various modalities. In this dissertation, I use sentiment analysis in conjunction with natural language processing to identify, quantify, and classify emotions in text. Specifically, emotions are examined in multilingual settings using multidimensional models of emotions. Plutchik's wheel of emotions and emotional intensities are used to classify emotions in parallel corpora via both lexical methods and supervised machine learning methods. By analyzing emotional language content in text, the connection between language and emotions can be better understood. I have developed new approaches to create a more equitable natural language processing approach for sentiment analysis, meaning the development and evaluation of massively multilingual annotated datasets, contributing to the provision of tools for under-resourced languages. This dissertation is comprised of ten articles on related topics in sentiment analysis. In these articles, I discuss lexicon-based methods and the creation of emotion and sentiment lexicons, the creation of datasets for supervised machine learning, the training of models for supervised machine learning, and the evaluation of such models. I also examine the annotation process in relation to creating datasets in depth, including the creation of a light-weight easily deployed annotation platform. As an additional step, I test the different approaches in downstream applications. These practical applications include the study of political party rhetoric from the perspective of emotion words used and the intensities of those emotion words. I also examine how simple lexicon-based methods can be used to make the study of affect in literature less subjective. Additionally, I attempt to link sentiment analysis with hate speech detection and offensive speech target identification. The main contribution of this dissertation is in providing tools for sentiment analysis and in demonstrating how these tools can be augmented for use in a wide variety of languages and practical applications at low cost. en
dc.description.abstract Tunteet ovat aina olleet keskeisessä asemassa ihmiskokemuksessa: muinaisilla kreikkalaisilla oli filosofisia keskusteluja tunteiden luonteesta, ja Charles Darwinin voidaan sanoa perustaneen modernit tunneteoriat kirjallaan “Tunteiden ilmaisu ihmisissä ja eläimissä“. Tunneteorioita tutkitaan edelleen aktiivisesti monilla eri aloilla psykologiasta, kognitiotieteestä ja antropologiasta tietojenkäsittelytieteeseen. Sentimenttianalyysi viittaa yleensä tunteiden tunnistamiseen ja erottamiseen laskennallisin menetelmin eri modaliteeteissä. Tässä väitöskirjassa käytän sentimenttianalyysiä yhdessä kieliteknologian menetelmien kanssa tunteiden tunnistamiseksi, kvantifioimiseksi ja luokittelemiseksi tekstissä. Erityisesti tutkin tunteita ja niiden käyttöä monikielisissä ympäristöissä käyttäen moniulotteisia tunnemalleja. Hyödynnän Plutchikin tunnepyörää ja emotionaalisia intensiteettejä rinnakkaiskorpuksissa esiintyvien tunteiden luokittelussa sekä leksikaalisten että valvottujen koneoppimismenetelmien avulla. Analysoimalla tekstin emotionaalista kieltä voidaan paremmin ymmärtää kielen ja tunteiden välistä yhteyttä. Olen kehittänyt uusia lähestymistapoja helpottamaan massiivisesti monikielisen annotoidun datan kehittämistä ja arviointia, mikä osaltaan auttaa tarjoamaan työkaluja pieniresurssisille kielille. Tämä väitöskirja koostuu kymmenestä artikkelista, jotka kytkeytyvät eri tavoin sentimenttianalyysiin. Näissä artikkeleissa käsittelen leksikkopohjaisia menetelmiä, sentimentti- ja emootioleksikkojen kehitystä, datan keräystä koneoppimista varten sekä koneoppimismallien arviointia datan avulla. Lisäksi sovellan näitä lähestymistapoja yhteiskuntatieteissä ja kirjallisuustieteissä. Tutkin myös annotaatioprosessin vaikutusta annotoijien tuottaman datan laatuun Sentimentator-annotaatiotyökalun kehitystyöhon pohjautuen. Tämän väitöskirjan tärkein kontribuutio on tekstianalyysityökalujen kehittäminen sekä niiden hyödyllisyyden osoittaminen useilla eri kielillä ja erilaisissa käytännön sovelluksissa. fi
dc.format.mimetype application/pdf
dc.language.iso en
dc.publisher Helsingin yliopisto fi
dc.publisher Helsingfors universitet sv
dc.publisher University of Helsinki en
dc.relation.isformatof URN:ISBN:978-951-51-7105-4
dc.relation.isformatof 2021
dc.rights Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. fi
dc.rights This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited. en
dc.rights Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden. sv
dc.subject language Technology / Digital Humanities
dc.title The Language of Emotions : Building and Applying Computational Methods for Emotion Detection for English and Beyond en
dc.type.ontasot Väitöskirja (artikkeli) fi
dc.type.ontasot Doctoral dissertation (article-based) en
dc.type.ontasot Doktorsavhandling (sammanläggning) sv
dc.ths Honkela, Timo
dc.ths Tiedemann, Jörg
dc.ths Säily, Tanja
dc.opn Ovesdotter Alm, Cecilia
dc.type.dcmitype Text

Files in this item

Total number of downloads: Loading...

Files Size Format View
öhman_emily_dissertation_2021.pdf 1.718Mb PDF View/Open

This item appears in the following Collection(s)

Show simple item record