Puhutun kielen segmentointi lausemaisiksi yksiköiksi

Visa fullständig post



Permalänk

http://urn.fi/URN:NBN:fi-fe20041953
Titel: Puhutun kielen segmentointi lausemaisiksi yksiköiksi
Författare: Dannenberg, Anna
Medarbetare: Helsingin yliopisto, Humanistinen tiedekunta, Yleisen kielitieteen laitos
University of Helsinki, Faculty of Arts, Department of General Linguistics
Helsingfors universitet, Humanistiska fakulteten, Institutionen för allmän språkvetenskap
Utgivare: Helsingfors universitet
Datum: 2004
Språk: fin
Permanenta länken (URI): http://urn.fi/URN:NBN:fi-fe20041953
http://hdl.handle.net/10138/19335
Nivå: pro gradu-avhandlingar
Abstrakt: Puhutun kielen segmentointiin ei ole olemassa kaikkiin tarkoituksiin sopivaa, yleisesti hyväksyttyä ja toimivaa menetelmää - kirjoitettu kieli segmentoituu lauseiksi ja virkkeiksi, mutta puhetta segmentoidaan monin eri tavoin tilanteesta ja tarkoituksesta riippuen. Tähän on vaikuttanut kirjoitetun kielen keskeinen asema kielitieteellisessä tutkimuksessa: kirjoitusta on tutkittu enemmän ja kauemmin kuin puhetta, ja lisäksi kirjoitettu kieli vaikuttaa ihmisten kielikäsityksiin myös tiedostamattomalla tasolla, joten puhetta on vasta viime aikoina alettu tarkastella sen omista lähtökohdista käsin. Pro gradu -tutkielmassani vertaan keskenään kolmea puhutun kielen segmentointitapaa, jotka perustuvat erilaisiin teorioihin puheen luonteesta. Ensimmäinen on pohjoismaiseen Talsyntax-projektiin perustuva puhtaasti syntaktinen analyysimalli, jonka mukaiset segmentit ovat syntaktisesti itsenäisiä makrosyntagmoja. Toinen on Wallace Chafen ajattelua mukaileva kognitiivisperustainen segmentointitapa, jossa puheen katsotaan koostuvan ihmisen kognition toimintaa heijastavista ajatusyksiköistä. Kolmas malli perustuu David Brazilin teoriaan, jossa intonaatio ja kommunikaatio liittyvät olennaisesti toisiinsa, ja tämän mallin mukaan puhe segmentoituu kommunikaation kannalta merkityksellisiksi intonaatiojaksoiksi. Mallien vertailupohjana toimii erilaisista puhetilanteista koostuva 15 minuutin puhekorpus, jonka olen segmentoinut kaikkien kolmen mallin mukaisesti ja verrannut segmentointituloksia toisiinsa. Tutkimukseni osoittaa, että intonaatioon, kognitioon ja syntaksiin pohjautuvat segmentointitavat tuottavat hyvin samantapaisia tuloksia: segmenttien rajakohdista suurin osa on kaikkien kolmen segmentointitavan mukaisia. Erityisesti intonaatioon ja syntaksiin perustuvien analyysien tulokset ovat hyvin samankaltaisia, kun taas kognitiivispohjaisen segmentointitavan mukaiset tulokset eroavat muista enemmän ja se on myös tulkinnanvaraisempi. Kun puhuttu teksti segmentoidaan sekä intonaatiojaksoiksi että makrosyntagmoiksi, syntyvistä segmenteistä on molempien segmentointitapojen suhteen yhteneviä noin 85 % ja niihin kuuluu kaikista tekstin sanoista lähes 60 %. Eri segmentointitapojen suhteen yhteneviä segmenttejä ovat tyypillisesti minimipalautteet ja muut lyhyet puheenvuorot, ja lisäksi yhtenevyys on tyypillistä kysymyksille sekä puhujan ja puheenaiheen vaihtumiskohdille. Epäyhtenevyyttä puolestaan esiintyy lähinnä tilanteissa, joissa sama henkilö on pitkään yhtäjaksoisesti äänessä: mitä pidempi yhtenäinen puhejakso, sitä vaikeampi puhujan on hahmottaa sitä kokonaisuutena, joten sellaisiin muodostuu helpommin intonationaalisia tai syntaktisia epäjohdonmukaisuuksia. Tuloksista voidaan päätellä, että intonaatio ja syntaksi sekä jossain määrin myös kognitio liittyvät olennaisesti toisiinsa puhutussa kielessä. Jos tarkoituksena on löytää yleisesti hyväksyttävä ja toimiva puhutun kielen segmentointitapa, intonationaalis-syntaktinen segmentointi vaikuttaisi olevan hyvä lähtökohta.
Subject: puhuttu kieli
puhe
segmentointi
lause
intonaatio
kognitio
syntaksi
Licens: Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.


Filer under denna titel

Totalt antal nerladdningar: Laddar...

Filer Storlek Format Granska
puhutunk.pdf 596.4Kb PDF Granska/Öppna
tiiviste.pdf 79.58Kb PDF Granska/Öppna

Detta dokument registreras i samling:

Visa fullständig post