Puhutun kielen segmentointi lausemaisiksi yksiköiksi

Näytä kaikki kuvailutiedot



Pysyväisosoite

http://urn.fi/URN:NBN:fi-fe20041953
Julkaisun nimi: Puhutun kielen segmentointi lausemaisiksi yksiköiksi
Tekijä: Dannenberg, Anna
Muu tekijä: Helsingin yliopisto, Humanistinen tiedekunta, Yleisen kielitieteen laitos
University of Helsinki, Faculty of Arts, Department of General Linguistics
Helsingfors universitet, Humanistiska fakulteten, Institutionen för allmän språkvetenskap
Julkaisija: Helsingfors universitet
Päiväys: 2004
Kieli: fin
URI: http://urn.fi/URN:NBN:fi-fe20041953
http://hdl.handle.net/10138/19335
Opinnäytteen taso: pro gradu -tutkielmat
Tiivistelmä: Puhutun kielen segmentointiin ei ole olemassa kaikkiin tarkoituksiin sopivaa, yleisesti hyväksyttyä ja toimivaa menetelmää - kirjoitettu kieli segmentoituu lauseiksi ja virkkeiksi, mutta puhetta segmentoidaan monin eri tavoin tilanteesta ja tarkoituksesta riippuen. Tähän on vaikuttanut kirjoitetun kielen keskeinen asema kielitieteellisessä tutkimuksessa: kirjoitusta on tutkittu enemmän ja kauemmin kuin puhetta, ja lisäksi kirjoitettu kieli vaikuttaa ihmisten kielikäsityksiin myös tiedostamattomalla tasolla, joten puhetta on vasta viime aikoina alettu tarkastella sen omista lähtökohdista käsin. Pro gradu -tutkielmassani vertaan keskenään kolmea puhutun kielen segmentointitapaa, jotka perustuvat erilaisiin teorioihin puheen luonteesta. Ensimmäinen on pohjoismaiseen Talsyntax-projektiin perustuva puhtaasti syntaktinen analyysimalli, jonka mukaiset segmentit ovat syntaktisesti itsenäisiä makrosyntagmoja. Toinen on Wallace Chafen ajattelua mukaileva kognitiivisperustainen segmentointitapa, jossa puheen katsotaan koostuvan ihmisen kognition toimintaa heijastavista ajatusyksiköistä. Kolmas malli perustuu David Brazilin teoriaan, jossa intonaatio ja kommunikaatio liittyvät olennaisesti toisiinsa, ja tämän mallin mukaan puhe segmentoituu kommunikaation kannalta merkityksellisiksi intonaatiojaksoiksi. Mallien vertailupohjana toimii erilaisista puhetilanteista koostuva 15 minuutin puhekorpus, jonka olen segmentoinut kaikkien kolmen mallin mukaisesti ja verrannut segmentointituloksia toisiinsa. Tutkimukseni osoittaa, että intonaatioon, kognitioon ja syntaksiin pohjautuvat segmentointitavat tuottavat hyvin samantapaisia tuloksia: segmenttien rajakohdista suurin osa on kaikkien kolmen segmentointitavan mukaisia. Erityisesti intonaatioon ja syntaksiin perustuvien analyysien tulokset ovat hyvin samankaltaisia, kun taas kognitiivispohjaisen segmentointitavan mukaiset tulokset eroavat muista enemmän ja se on myös tulkinnanvaraisempi. Kun puhuttu teksti segmentoidaan sekä intonaatiojaksoiksi että makrosyntagmoiksi, syntyvistä segmenteistä on molempien segmentointitapojen suhteen yhteneviä noin 85 % ja niihin kuuluu kaikista tekstin sanoista lähes 60 %. Eri segmentointitapojen suhteen yhteneviä segmenttejä ovat tyypillisesti minimipalautteet ja muut lyhyet puheenvuorot, ja lisäksi yhtenevyys on tyypillistä kysymyksille sekä puhujan ja puheenaiheen vaihtumiskohdille. Epäyhtenevyyttä puolestaan esiintyy lähinnä tilanteissa, joissa sama henkilö on pitkään yhtäjaksoisesti äänessä: mitä pidempi yhtenäinen puhejakso, sitä vaikeampi puhujan on hahmottaa sitä kokonaisuutena, joten sellaisiin muodostuu helpommin intonationaalisia tai syntaktisia epäjohdonmukaisuuksia. Tuloksista voidaan päätellä, että intonaatio ja syntaksi sekä jossain määrin myös kognitio liittyvät olennaisesti toisiinsa puhutussa kielessä. Jos tarkoituksena on löytää yleisesti hyväksyttävä ja toimiva puhutun kielen segmentointitapa, intonationaalis-syntaktinen segmentointi vaikuttaisi olevan hyvä lähtökohta.
Avainsanat: puhuttu kieli
puhe
segmentointi
lause
intonaatio
kognitio
syntaksi
Tekijänoikeustiedot: Publikationen är skyddad av upphovsrätten. Den får läsas och skrivas ut för personligt bruk. Användning i kommersiellt syfte är förbjuden.


Tiedostot

Latausmäärä yhteensä: Ladataan...

Tiedosto(t) Koko Formaatti Näytä
puhutunk.pdf 596.4KB PDF Avaa tiedosto
tiiviste.pdf 79.58KB PDF Avaa tiedosto

Viite kuuluu kokoelmiin:

Näytä kaikki kuvailutiedot