Puhutun kielen segmentointi lausemaisiksi yksiköiksi

Show full item record



Permalink

http://urn.fi/URN:NBN:fi-fe20041953
Title: Puhutun kielen segmentointi lausemaisiksi yksiköiksi
Author: Dannenberg, Anna
Other contributor: Helsingin yliopisto, Humanistinen tiedekunta, Yleisen kielitieteen laitos
University of Helsinki, Faculty of Arts, Department of General Linguistics
Helsingfors universitet, Humanistiska fakulteten, Institutionen för allmän språkvetenskap
Publisher: Helsingfors universitet
Date: 2004
Language: fin
URI: http://urn.fi/URN:NBN:fi-fe20041953
http://hdl.handle.net/10138/19335
Thesis level: master's thesis
Abstract: Puhutun kielen segmentointiin ei ole olemassa kaikkiin tarkoituksiin sopivaa, yleisesti hyväksyttyä ja toimivaa menetelmää - kirjoitettu kieli segmentoituu lauseiksi ja virkkeiksi, mutta puhetta segmentoidaan monin eri tavoin tilanteesta ja tarkoituksesta riippuen. Tähän on vaikuttanut kirjoitetun kielen keskeinen asema kielitieteellisessä tutkimuksessa: kirjoitusta on tutkittu enemmän ja kauemmin kuin puhetta, ja lisäksi kirjoitettu kieli vaikuttaa ihmisten kielikäsityksiin myös tiedostamattomalla tasolla, joten puhetta on vasta viime aikoina alettu tarkastella sen omista lähtökohdista käsin. Pro gradu -tutkielmassani vertaan keskenään kolmea puhutun kielen segmentointitapaa, jotka perustuvat erilaisiin teorioihin puheen luonteesta. Ensimmäinen on pohjoismaiseen Talsyntax-projektiin perustuva puhtaasti syntaktinen analyysimalli, jonka mukaiset segmentit ovat syntaktisesti itsenäisiä makrosyntagmoja. Toinen on Wallace Chafen ajattelua mukaileva kognitiivisperustainen segmentointitapa, jossa puheen katsotaan koostuvan ihmisen kognition toimintaa heijastavista ajatusyksiköistä. Kolmas malli perustuu David Brazilin teoriaan, jossa intonaatio ja kommunikaatio liittyvät olennaisesti toisiinsa, ja tämän mallin mukaan puhe segmentoituu kommunikaation kannalta merkityksellisiksi intonaatiojaksoiksi. Mallien vertailupohjana toimii erilaisista puhetilanteista koostuva 15 minuutin puhekorpus, jonka olen segmentoinut kaikkien kolmen mallin mukaisesti ja verrannut segmentointituloksia toisiinsa. Tutkimukseni osoittaa, että intonaatioon, kognitioon ja syntaksiin pohjautuvat segmentointitavat tuottavat hyvin samantapaisia tuloksia: segmenttien rajakohdista suurin osa on kaikkien kolmen segmentointitavan mukaisia. Erityisesti intonaatioon ja syntaksiin perustuvien analyysien tulokset ovat hyvin samankaltaisia, kun taas kognitiivispohjaisen segmentointitavan mukaiset tulokset eroavat muista enemmän ja se on myös tulkinnanvaraisempi. Kun puhuttu teksti segmentoidaan sekä intonaatiojaksoiksi että makrosyntagmoiksi, syntyvistä segmenteistä on molempien segmentointitapojen suhteen yhteneviä noin 85 % ja niihin kuuluu kaikista tekstin sanoista lähes 60 %. Eri segmentointitapojen suhteen yhteneviä segmenttejä ovat tyypillisesti minimipalautteet ja muut lyhyet puheenvuorot, ja lisäksi yhtenevyys on tyypillistä kysymyksille sekä puhujan ja puheenaiheen vaihtumiskohdille. Epäyhtenevyyttä puolestaan esiintyy lähinnä tilanteissa, joissa sama henkilö on pitkään yhtäjaksoisesti äänessä: mitä pidempi yhtenäinen puhejakso, sitä vaikeampi puhujan on hahmottaa sitä kokonaisuutena, joten sellaisiin muodostuu helpommin intonationaalisia tai syntaktisia epäjohdonmukaisuuksia. Tuloksista voidaan päätellä, että intonaatio ja syntaksi sekä jossain määrin myös kognitio liittyvät olennaisesti toisiinsa puhutussa kielessä. Jos tarkoituksena on löytää yleisesti hyväksyttävä ja toimiva puhutun kielen segmentointitapa, intonationaalis-syntaktinen segmentointi vaikuttaisi olevan hyvä lähtökohta.
Subject: puhuttu kieli
puhe
segmentointi
lause
intonaatio
kognitio
syntaksi
Rights: Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.


Files in this item

Total number of downloads: Loading...

Files Size Format View
puhutunk.pdf 596.4Kb PDF View/Open
tiiviste.pdf 79.58Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record