The Language of Emotions : Building and Applying Computational Methods for Emotion Detection for English and Beyond

Show full item recordPermalink

http://urn.fi/URN:ISBN:978-951-51-7106-1
Title: The Language of Emotions : Building and Applying Computational Methods for Emotion Detection for English and Beyond
Author: Öhman, Emily
Contributor: University of Helsinki, Faculty of Arts, Department of Digital Humanities
Doctoral Programme in Language Studies
Publisher: Helsingin yliopisto
Date: 2021-03-05
Language: en
URI: http://urn.fi/URN:ISBN:978-951-51-7106-1
http://hdl.handle.net/10138/325351
Thesis level: Doctoral dissertation (article-based)
Abstract: Emotions have always been central to the human experience: the ancient Greeks had philosophical debates about the nature of emotions and Charles Darwin can be said to have founded the modern theories of emotions with his study "The expression of the emotions in man and animals". Theories of emotion are still actively researched in many different fields from psychology, cognitive science, and anthropology to computer science. Sentiment analysis usually refers to the use of computational tools to identify and extract sentiments and emotions from various modalities. In this dissertation, I use sentiment analysis in conjunction with natural language processing to identify, quantify, and classify emotions in text. Specifically, emotions are examined in multilingual settings using multidimensional models of emotions. Plutchik's wheel of emotions and emotional intensities are used to classify emotions in parallel corpora via both lexical methods and supervised machine learning methods. By analyzing emotional language content in text, the connection between language and emotions can be better understood. I have developed new approaches to create a more equitable natural language processing approach for sentiment analysis, meaning the development and evaluation of massively multilingual annotated datasets, contributing to the provision of tools for under-resourced languages. This dissertation is comprised of ten articles on related topics in sentiment analysis. In these articles, I discuss lexicon-based methods and the creation of emotion and sentiment lexicons, the creation of datasets for supervised machine learning, the training of models for supervised machine learning, and the evaluation of such models. I also examine the annotation process in relation to creating datasets in depth, including the creation of a light-weight easily deployed annotation platform. As an additional step, I test the different approaches in downstream applications. These practical applications include the study of political party rhetoric from the perspective of emotion words used and the intensities of those emotion words. I also examine how simple lexicon-based methods can be used to make the study of affect in literature less subjective. Additionally, I attempt to link sentiment analysis with hate speech detection and offensive speech target identification. The main contribution of this dissertation is in providing tools for sentiment analysis and in demonstrating how these tools can be augmented for use in a wide variety of languages and practical applications at low cost.Tunteet ovat aina olleet keskeisessä asemassa ihmiskokemuksessa: muinaisilla kreikkalaisilla oli filosofisia keskusteluja tunteiden luonteesta, ja Charles Darwinin voidaan sanoa perustaneen modernit tunneteoriat kirjallaan “Tunteiden ilmaisu ihmisissä ja eläimissä“. Tunneteorioita tutkitaan edelleen aktiivisesti monilla eri aloilla psykologiasta, kognitiotieteestä ja antropologiasta tietojenkäsittelytieteeseen. Sentimenttianalyysi viittaa yleensä tunteiden tunnistamiseen ja erottamiseen laskennallisin menetelmin eri modaliteeteissä. Tässä väitöskirjassa käytän sentimenttianalyysiä yhdessä kieliteknologian menetelmien kanssa tunteiden tunnistamiseksi, kvantifioimiseksi ja luokittelemiseksi tekstissä. Erityisesti tutkin tunteita ja niiden käyttöä monikielisissä ympäristöissä käyttäen moniulotteisia tunnemalleja. Hyödynnän Plutchikin tunnepyörää ja emotionaalisia intensiteettejä rinnakkaiskorpuksissa esiintyvien tunteiden luokittelussa sekä leksikaalisten että valvottujen koneoppimismenetelmien avulla. Analysoimalla tekstin emotionaalista kieltä voidaan paremmin ymmärtää kielen ja tunteiden välistä yhteyttä. Olen kehittänyt uusia lähestymistapoja helpottamaan massiivisesti monikielisen annotoidun datan kehittämistä ja arviointia, mikä osaltaan auttaa tarjoamaan työkaluja pieniresurssisille kielille. Tämä väitöskirja koostuu kymmenestä artikkelista, jotka kytkeytyvät eri tavoin sentimenttianalyysiin. Näissä artikkeleissa käsittelen leksikkopohjaisia menetelmiä, sentimentti- ja emootioleksikkojen kehitystä, datan keräystä koneoppimista varten sekä koneoppimismallien arviointia datan avulla. Lisäksi sovellan näitä lähestymistapoja yhteiskuntatieteissä ja kirjallisuustieteissä. Tutkin myös annotaatioprosessin vaikutusta annotoijien tuottaman datan laatuun Sentimentator-annotaatiotyökalun kehitystyöhon pohjautuen. Tämän väitöskirjan tärkein kontribuutio on tekstianalyysityökalujen kehittäminen sekä niiden hyödyllisyyden osoittaminen useilla eri kielillä ja erilaisissa käytännön sovelluksissa.
Subject: language Technology / Digital Humanities
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
öhman_emily_dissertation_2021.pdf 1.718Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record