Title: | Generating Creative Language : Theories, Practice and Evaluation |
Author: | Hämäläinen, Mika |
Contributor organization: | University of Helsinki, Faculty of Arts, Department of Digital Humanities Doctoral Programme in Language Studies Helsingin yliopisto, humanistinen tiedekunta Kielentutkimuksen tohtoriohjelma Helsingfors universitet, humanistiska fakulteten Doktorandprogrammet i språkforskning |
Publisher: | Helsingin yliopisto |
Date: | 2020-10-28 |
Language: | eng |
URI: |
http://urn.fi/URN:ISBN:978-951-51-6707-1
http://hdl.handle.net/10138/319905 |
Thesis level: | Doctoral dissertation (article-based) |
Abstract: | This thesis presents approaches to computationally creative natural language generation focusing on theoretical foundations, practical solutions and evaluation. I defend that a theoretical definition is crucial for computational creativity and that the practical solution must closely follow the theoretical definition. Finally, evaluation must be based on the underlying theory and what was actually modelled in the practical solution.
A theoretical void in the existing theoretical work on computational creativity is identified. The existing theories do not explicitly take into account the communicative nature of natural language. Therefore, a new theoretical framework is elaborated that identifies how computational creativity can take place in a setting that has a clear communicative goal. This introduces a communicative-creative trade off that sets limits to creativity in such a communicative context. My framework divides creativity in three categories: message creativity, contextual creativity and communicative creativity. Any computationally creative NLG approach not taking communicativity into account is called mere surface generation.
I propose a novel master-apprentice approach for creative language generation. The approach consists of a genetic algorithm, the fitness functions of which correspond to different parameters defined as important for the creative task in question from a theoretical perspective. The output of the genetic algorithm together with possible human authored data are used to train the apprentice, which is a sequence-to-sequence neural network model. The role of the apprentice in the system is to approximate creative autonomy.
Evaluation is approached from three different perspectives in this work: ad-hoc and abstract, theory-based and abstract, and theory-based and concrete. The first perspective is the most common one in the current literature and its shortcomings are demonstrated and discussed. This starts a gradual shift towards more meaningful evaluation by first using proper theories to define the task being modelled and finally reducing the room for subjective interpretation by suggesting the use of concrete evaluation questions. Tämä väitöskirja esittelee lähestymistapoja laskennallisesti luovaan luonnollisen kielen tuottamiseen tietokoneella. Opinnäytetyö keskittyy teoreettisiin perusteisiin, ohjelmalliseen toteutukseen ja menetelmien arviointiin. Teoreettinen määritelmä on ratkaiseva laskennallisen luovuuden kannalta ja toteutuksen on noudatettava tarkasti teoreettista määritelmää. Lopuksi arvioinnin on perustuttava taustalla olevaan teoriaan sekä siihen, miten luova ohjelma on toteutettu. Esitän uutta mestari ja oppipoika -lähestymistapaa luovan kielen tuottamiseen koneellisesti. Lähestymistapa koostuu geneettisestä algoritmista, joka tuottaa kieltä niillä perusteilla, jotka on määritelty tärkeiksi kyseiselle luovalle tehtävälle teoreettisesta näkökulmasta. Geneettisen algoritmin tuotoksia käytetään yhdessä mahdollisten ihmisen tuotosten kanssa oppipojan materiaalina. Oppipoika on neuroverkkomalli, jonka rooli järjestelmässä on autonomisen luovuuden mallintaminen. |
Subject: | language Techonlogy |
Rights: | Julkaisu on tekijänoikeussäännösten alainen. Teosta voi lukea ja tulostaa henkilökohtaista käyttöä varten. Käyttö kaupallisiin tarkoituksiin on kielletty. |
Total number of downloads: Loading...
Files | Size | Format | View |
---|---|---|---|
hämäläinen_mika_dissertation_2020.pdf | 6.474Mb |
View/ |