Browsing by Subject "korpustutkimus"

Sort by: Order: Results:

Now showing items 1-12 of 12
 • Lindh, Mertsi (Helsingin yliopisto, 2022)
  Tässä työssä tutkitaan impersonaalirakenteita espanjan ja portugalin eurooppalaisten varieteettien välillä uutiskielessä. Tarkasteltavat rakenteet ovat ser-apuverbillä muodostettava perifrastinen passiivi ja se-rakenteet, jotka voidaan jakaa passiivisiin ja impersonaalisiin rakenteisiin. Tavoitteena on selvittää, kummankielisessä korpuksessa tutkittavat rakenteet ovat kokonaisuudessaan yleisempiä ja kummat rakenteet ovat yleisempiä kussakin korpuksessa. Korpusten uutiset on jaettu seitsemään osastoon, jotka ovat yhteiskunta, politiikka, talous, urheilu, kulttuuri, tiede sekä teknologia. Tavoitteena on täten myös tutkia, esiintyykö rakenteita tyypillisemmin joissain tietyissä osastoissa. Funktionaalisesta näkökulmasta yksi impersonaalirakenteiden tehtävistä on agentin häivyttäminen (Siewierska 2008). Espanjaa ja portugalia pidetään tässä tutkimuksessa saman järjestelmän eri variantteina, sillä ne ovat geneettisesti niin läheistä sukua toisilleen (vrt. Moravcsik 2016). Tämän ansiosta molempien kielten rakenteisiin voidaan soveltaa samaa luokittelua. Impersonaalirakenteiden luokittelu pohjautuu Barrenechean ja M. de Rosettin (1979) malliin. Uutisten laadullisessa tarkastelussa hyödynnetään puolestaan Reinemann et al.:n (2011) luokittelua. Tutkimuksen korpukset koostuvat uutisista, jotka on espanjan osalta kerätty El Mundo- ja portugalin osalta O Diário de Notícias -sanomalehdestä ja jotka ajoittuvat vuosille 2017–2019. Espanjan korpuksen koko on 143 909 sanaa ja portugalin korpuksen koko 87 593 sanaa. Aineiston keruussa on hyödynnetty Corpus del Español NOW- (News on the Web) (Davies 2018–) ja Corpus do Português NOW (Davies 2018–) -internetkorpuksia, joiden pohjalta on koostettu oma korpus analyysia varten. Tulokset osoittavat impersonaalirakenteiden olevan yleisempiä portugalin korpuksessa kuin espanjan korpuksessa. Portugalin korpuksen normalisoitu frekvenssi on 93,6 tapausta 10 000:ta sanaa kohti ja espanjan korpuksen 82,5 tapausta 10 000:ta sanaa kohti. Korpusten välinen ero on tilastollisesti merkitsevä (G² = 7,71; p < 0,01). Espanjan korpuksessa se-rakenteet (58,6) ovat yleisempiä kuin perifrastinen passiivi (23,8). Portugalin korpuksessa vastaavasti perifrastinen passiivi (81,4) on yleisempi kuin se-rakenteet (12,2). Espanjan korpuksessa impersonaaliset rakenteet ovat tyypillisimpiä yhteiskunta- (100,7), kulttuuri- (99,7) ja tiedeaiheisissa (94,6) uutisissa ja harvinaisimpia urheilu-uutisissa (27,9). Portugalin korpuksessa ne ovat tyypillisimpiä puolestaan yhteiskunta- (135,9), politiikka- (89,3) ja kulttuuriosastoissa (87,7) ja harvinaisimpia urheiluosastossa (52,7). Portugalin korpuksessa impersonaalirakenteet ovat espanjan korpusta yleisempiä yhteiskunta-, politiikka-, urheilu- ja teknologia-aiheisissa uutisissa. Näissä kaikissa paitsi teknologiassa ero korpusten välillä on tilastollisesti merkitsevä. Espanjan korpuksessa rakenteet ovat yleisempiä talous-, kulttuuri- ja tiedeosastoissa, mutta näissä missään ero korpusten välillä ei ole tilastollisesti merkitsevä. Tyylillisesti suurimmat erot korpusten välillä havaitaan urheiluosastossa, sillä espanjan urheilu-uutisten kieli on huomattavasti kuvailevampaa kuin portugalin. Kaikki löydöt viittaavat uutiskielen olevan portugalin korpuksessa muodollisempaa kuin espanjan korpuksessa. Laajemmat johtopäätökset eri impersonaalirakenteiden käytöstä kielten välillä vaativat kuitenkin lisätutkimusta.
 • Liukonen, Saija (Helsingin yliopisto, 2018)
  Tutkielmani tavoitteena on selvittää millä tavoin metadiskurssia käytetään vaikuttamisen keinona poliittisessa puheessa. Tutkielman poliittinen konteksti on vuoden 2016 kansanäänestys Iso-Britannian EU-jäsenyydestä, ja itse kokoamani korpusaineisto koostuu silloisen pääministerin David Cameronin puheista ja haastatteluista viideltä kuukaudelta ennen äänestystä. Tutkielmassani tarkastelen kuinka Cameron käyttää suostuttelussa hyväkseen metadiskurssia, mitä käytetyt metadiskurssielementit kertovat Cameronin retorisesta strategiasta ja millä tavalla puheiden retoriikka muuttui viimeisenä kuukautena ennen äänestystä. Aihetta käsitellään metadiskurssin, poliittisen puheen ja retoriikan tutkimuksen näkökulmasta. Puheista tekemäni laadullinen ja määrällinen kielitieteellinen korpusanalyysi selvittää kuinka metadiskurssia käytetään kielellisenä suostuttelun keinona. Puheista löytämäni metadiskurssin ilmentymät on jaoteltu Hylandin (2005) luokittelun perusteella kahteen pääkategoriaan: interaktiiviseen (interactive) ja vuorovaikutteiseen (interactional) metadiskurssiin. Aineistoa analysoitiin samanaikaisesti myös Aristoteleen vaikuttamisen keinojen, eetoksen, paatoksen ja logoksen, avulla. Eetoksen tarkoitus on vakuuttaa yleisö puhujan uskottavuudesta ja luotettavuudesta; paatoksella pyritään vetoamaan yleisön tunteisiin, logoksella taas yleisön järkeen. Tulokseni osoittavat Cameronin käyttävän metadiskurssia edistääkseen puheidensa eetosta, paatosta ja logosta. Interaktiivisen metadiskurssin avulla puhujat organisoivat tekstinsä, millä on vaikutus tekstin logokseen. Vuorovaikutteinen metadiskurssi taas auttaa luomaan eetosta ja paatosta. Eetosta rakennetaan itseviittauksilla (self mentions), vahvistuksilla (boosters), varauksilla (hedges) sekä direktiiveillä (directives), kun taas paatoksen välineinä puhujat käyttävät asennemarkkereita (attitude markers), inklusiivista me-muotoa (inclusive we), retorisia kysymyksiä ja eksplisiittisiä viittauksia yleisöön. Tulokseni osoittavat myös Cameronin retorisessa strategiassa tapahtuneen tilastollisesti merkitseviä muutoksia viimeisen kampanjointikuukauden aikana. Cameron esimerkiksi lisäsi metadiskurssipartikkeleiden käyttöä molemmissa pääkategorioissa. Tutkielmassani esitän uuden kielitieteellisen tavan tarkastella poliittista puhetta ja vaikuttamisen keinoja sekä osoitan metadiskurssin olevan tärkeä osa retoriikkaa. Tutkimus osoittaa myös menetelmäni sopivan muiden suostutteluun pyrkivien genrejen analysointiin. Vertailtaessa tuloksiani esimerkiksi kirjoitettuun akateemiseen diskurssiin käy ilmi, että puhuttu poliittinen diskurssi on metadiskurssin osalta todella rikasta.
 • Heinänen, Olli (Helsingin yliopisto, 2019)
  Tutkielma käsittelee komin kielen edessä ja takana ilmaisuja korpus-, kysely- ja haastattelututkimuksen keinoin. Teoreettisina lähestymistapoina ovat kieliopillistumisen teoria ja kognitiivisen kielitieteen teoriakehykset sekä teoriat erilaisista viitekehyksistä. Komin kielen postpositioiden roolista ja käytöstä ei ole kirjoitettu paljoakaan millään kielellä. Sanakirjoistakaan ei aukene kattavaa kuvaa. Osasta sanoja kerrotaan, käytetäänkö postpositiona vai adverbina tai molempina, mutta näin ei ole aina asioiden laita. Lisäksi kuva siitä, onko käyttö spatiaalista tai temporaalista, jää myös vajaaksi. Komissa on rikas postpositiojärjestelmä, sillä paikallissijoja on seitsemän kappaletta, ja yhdellä niistä on kaksi muotoa. Lisäksi on mahdollista liittää possessiivisuffikseja, jotka komin tapauksessa yleisimmin liittyvät itse postpositioon. Suurin osa tapauksista on tätä tyyppiä. Aiempaa tutkimushistoriaa tarkastellaan esittelemällä kohtalaisen laaja otos vanhempaa ja uudempaa kielioppi- ja oppikirjamateriaalia sekä muuta aineistoa. Niissä on mielenkiinnon kohteena ollut, mitä kerrotaan postpositioista yleensä ja varsinkin tämän tutkielman tarkastelemista postpositioista. Korpustutkimusosuudessa on ollut käytettävissä itse koostettu korpus ja internetissä tarjolla oleva komin kielen korpus. Kyselytutkimus suoritettiin yliopiston e-lomakkeella, joka tarjoaa lisäksi helpon tulosten keräysmahdollisuuden. Haastattelut täydentävät osaltaan saatua kokonaiskuvaa. Viitekehyksistä esiintyy luontaista ja suhteellista, mutta ei absoluuttista. Suhteellinen viitekehys on samaa tyyppiä kuin muissakin Euroopan kielissä. Kieliopillistumisen osalta voidaan todeta, että teoksissa esitetystä ketjusta ainakin osa toteutuu. Selvimmin väli spatiaalisesta temporaaliseen. Myös havaitaan, että jonkin takaosasta takapuolella olevaksi paikaksi toteutuu. Kognitiivisella puolella nähdään, että verbikollokaatioissa liikeverbit, aistihavaintoverbit ja mentaaliset verbit muodostavat selkeän ryhmänsä. Ajanilmauksissa ovat liittyvät nominitkin aikaa ilmaisevia, mutta muunlaisetkin ovat mahdollisia. Tarkasteltavia perusvartaloita on kolme bör, saj ja vodz. Kaksi ensimmäistä liittyvät takanaoloon tai myöhemmin tapahtumiseen ja viimeinen edessäoloon ja aikaisemmin tapahtumiseen. Ensimmäisellä ja viimeisellä on lisäksi kaksi johdettua vartaloa börvyv ja börlador sekä vodzvyv ja vodzlador. Lisäksi kaikista perusvartaloista ja johdoksista voidaan muodostaa lähikohtasijamuotoja. Sellaisissa approksimatiivin päätteen perään liittyy muiden paikallissijojen muotoja. Näihin kaikkiin esiteltyihin voi liittää possessiivisuffikseja. Muut kuin lähikohtasijat (jotka ovat jo taipuneita muotoja) taipuvat siis seitsemän paikallissijan kahdeksassa muodossa. Tutkielmassa pääpaino on ollut bör -vartalolla ja sen johdoksilla. Kahdesta muusta vartalotyypistä suurin osa tiedosta on peräisin kyselytutkimuksesta ja haastatteluista. bör -vartaloisilla ja sen johdoksilla esiintyy spatiaalista ja temporaalista käyttöä sekä postpositioina tai adverbeina. Niihin liittyy possessiivisuffikseja. Kaikkein yleisimmin se on 3. persoonan suffiksi, jolla on myös definiittistä käyttöä. Kieliopillistumiskehitystä kuvaa se, että börvyv- ja börlador- vartaloisilla ei ole temporaalista käyttöä kuin poikkeuksellisesti, minkä voisi katsoa kuvaavan niiden nuorempaa ikää. Niille ei olisi vielä ehtinyt kehittyä temporaalista merkitystä spatiaalisesta. Vartaloista saj liittyy staattiseen kiintopisteeseen ja bör enimmäkseen dynaamiseen spatiaalisessa käytössä. bör -vartalon johdetut muodot voivat liittyä myös staattiseen kiintopisteeseen. Lisäksi ne paikkaavat aukkoa, joka syntyy siitä, että saj -vartaloa käytetään vain postpositiona eikä adverbina.
 • Ainiala, Terhi; Jantunen, Jarmo H. (2019)
  Artikkelissamme selvitämme Helsinkiä tarkoittavien slanginimien, Hesan ja Stadin, käyttöä uudentyyppisen aineiston ja menetelmän avulla. Aiemmissa näitä nimiä koskevissa tutkimuksissa lähtökohta on ollut kvalitatiivinen, mutta tässä tutkimuksessa lähdemme liikkeelle laajasta digitaalisesta aineistosta ja tilastollisista menetelmistä. Tutkimuksemme on uusi avaus nimistöntutkimuksessa, ja nimitämme sitä korpusavusteiseksi nimistöntutkimukseksi, lyhyemmin korpusonomastiikaksi. Aineistonamme on laaja Suomi24-keskustelufoorumista muodostettu ja Kielipankista saatava Suomi24-korpus, josta olemme hakeneet Hesa- ja Stadi-nimet. Tutkimus toteutetaan korpusavusteisena diskurssintutkimuksena. Molemmat nimet esiintyvät aineistossa yli 45 000 kertaa. Analyysimme alkaa tilastollisesta kollokaatioanalyysista, minkä jälkeen kummankin nimen kollokaateista on valittu tarkasteltavaksi 200 merkitsevintä kollokaattia. Kollokaatit on ryhmitelty merkityksensä perusteella luokkiin, jotka muodostavat näiden sanojen kontekstista fraseologisin perustein havaittavan diskurssiprosodian. Hesa- ja Stadi-nimet jakavat yhteisiä diskursseja, mutta niillä on myös omia diskurssejaan. Hesaa käytetään, kun Helsinkiä katsotaan ulkopuolelta ja se on esimerkiksi muuttamisen tai matkustamisen kohde; lisäksi Hesasta jatketaan matkaa muualle, mikä näkyy monina kaupunkia merkitsevinä kollokaatteina. Erilaisista paikoista ja kaupungeista sekä liikkumisesta ja matkustamisesta keskustelu onkin Hesan yhteydessä tavallista. Stadi-nimi kuvastaa puolestaan syntyperäistä ja aitoa helsinkiläistä identiteettiä, mikä tukee aiempia havaintoja nimen käytöstä. Stadia käytetäänkin juuri silloin, kun puhutaan "meistä stadilaista" ja katsotaan kaupunkia ikään kuin sisältäpäin. ”Stadilaisuutta” korostetaan myös slangisanojen käytöllä Stadi-nimen yhteydessä, ja toisinaan muulta tulleista käytetyt nimitykset ovat melko affektiivisia. Menetelmämme nostaa esiin uutena piirteenä erityisesti sen, että matkustaminen ja liikkuminen on erityisesti Hesaan liittyvien diskurssien läpileikkaava teema. Myös Stadiin liittyy liikkuminen, mutta näkökulma on selvästi erilainen: liikkuminen tapahtuu pikemmin Stadissa kuin sitä kohti tai sieltä pois. Aiempaa tutkimusta tukevat havainnot, jotka liittyvät aidon helsinkiläisen identiteettiin korostamiseen Stadi-nimellä.
 • Lukkari, Lotta (Helsingin yliopisto, 2020)
  Tämä pro gradu -tutkielma tutkii koodinvaihtoa suomen kieleen englannin suullisen kielitaidon kokeen aikana. Tutkielma keskittyy koodinvaihdon tarkoituksiin ja määrään. Lisäksi selvitetään, onko oppilaiden suullisella kielitaidolla ja koodinvaihdon käytöllä mahdollista yhteyttä. Aineistona tutkielmaan käytetään HY-Talk- ja FUSE-korpusaineistoja. HY-Talk-aineistoon on kerätty 7.-luokkalaisten ja lukiolaisten puhutun kielen kokeita ja FUSE-aineisto koostuu lukiolaisten puhutun kielen kokeista. Englannin kielen rooli maailmanlaajuisena lingua francana asettaa uusia haasteita kielenopetukseen. Erilaiset kommunikatiiviset strategiat, mukaan lukien koodinvaihto, ovat hyväksyttäviä jokapäiväisessä kommunikaatiossa, minkä tulisi heijastua myös kielen opetukseen kouluissa. Oppilaiden kohtuullisella äidinkielen käytöllä oppimistehtävien aikana on näytetty olevan edullisia vaikutuksia. Kun koodinvaihto on sallittua sekä kouluympäristössä että sen ulkopuolella, on oletettavaa, että sitä esiintyisi myös koetilanteessa. Suullisen kielitaidon kokeen aikana tapahtuvaa koodinvaihtoa on kuitenkin tutkittu toistaiseksi hyvin vähän, ja tämä tutkielma pyrkii korvaamaan tätä puutetta. Käytin Antconc-korpusohjelmistoa löytäkseni koodinvaihdot HY-Talk- ja FUSE-korpusaineistoista. Lisäksi selvitin koodinvaihtoa käyttäneiden lukio-opiskelijoiden arvosanat, jotta mahdollista yhteyttä koodinvaihdon tehtävään ja määrään voitaisiin analysoida. Tuloksista selvisi, että oppilaat käyttivät koodinvaihtoa kohtuudella englannin suullisen kielitaidon kokeen aikana. Tulokset osoittavat, että oppilaat käyttivät koodinvaihtoa 12 erilaiseen tehtävään puhutun kielitaidon kokeen aikana. Nämä tehtävät jaettiin kolmeen suurempaan kategoriaan: tehtävän hallinta, sanasto ja muut tehtävän ulkopuoliset toiminnot. Saatujen tuloksien mukaan heikomman kielitaidon oppilaat käyttivät koodinvaihtoa enemmän sanastoon liittyviin toimintoihin kuin korkeamman kielitaidon oppilaat, kun taas korkeamman kielitaidon oppilaat nojasivat koodinvaihtoon tehtävän hallinnallisia tehtäviä varten. Tutkimuksestani selviää, että Englannin suullisen kielitaidon kokeissa tapahtuva koodinvaihto muistuttaa aiemmissa tutkimuksissa löydettyä, luokkatilanteessa tapahtuvaa koodinvaihtoa. Koska koodinvaihto on hyödyllinen työkalu kommunikaatiolle sekä luokkahuoneessa että sen ulkopuolella, väitän, ettei kohtuullista koodinvaihdosta tulisi rangaista myöskään koetilanteessa ja sitä myöten arvioinnissa.
 • Biri, Ylva (Helsingin yliopisto, 2017)
  The purpose of this study is to analyse the use of metadiscourse in English speaking opinion writing on blogs, news sites and the websites of newspapers. Metadiscourse is a theoretical framework for describing linguistic constructions used to structure or comment on the discourse of a text. How metadiscourse is used depends on the genre and the audience of the text. Previous research, much of which has been qualitative, has shown that metadiscourse is used in opinion writing partly to make the author’s viewpoint more organised and understandable, partly to appeal to the audience in a more direct manner. The aim of this study is to describe how different types of metadiscourse correlate with each other, that is, which types of metadiscourse often occur in the same text. The method used is Multi-Dimensional Analysis, a corpus-driven quantitative method based on Factor Analysis. The data used is a collection of blogposts and opinion articles; the corpus of 285,000 words has been annotated with 13 metadiscourse marker categories. The Multi-dimensional analysis yields four statistically significant factors that describe the rhetorical strategies used to acknowledge the elements in the text and the presence of the author and the reader. The four factors are named according to their functions as (1) Writer-oriented text, (2) Solidarity, (3) Reader-oriented text, and (4) Intertextuality. The analysis compares blogs, news sites and the websites of newspapers from the perspective of genre analysis. The results show a range of variation between writers of the same genre, but in general opinion writing from the websites of newspapers is low on metadiscourse and it is used mainly to refer to cited sources. Meanwhile, news sites tend to refer to the reader through the pronoun “you” or the pronoun “we”, which in context can be understood to include the reader. Bloggers refer more often to themselves than to their readers and rarely use the inclusive “we”. The genres blogs and news sites also contain the least explicit references to sources. This study is an example of how metadiscourse can be analysed using a Multi-dimensional method. Even a study based on a smaller dataset can yield information that can be used to develop the theoretical framework of metadiscourse.
 • Haakana, Viljami (Helsingin yliopisto, 2020)
  Tämä työ tarkastelee suomen kielen rajageminaation eli loppukahdennuksen aiheuttavien sanojen käyttäytymistä vokaalialkuisten sanojen edellä. Tietyt sananmuodot, kuten herne ja tule, aiheuttavat seuraavan sanan alkukonsonantin pidentymisen: hernekeitto lausutaan ”hernekkeitto” ja tule tänne lausutaan ”tulet tänne”. Vokaalialkuisen sanan edellä (esim. ei aloiteta alusta) tilanne on monimutkaisempi. Työssä kuuntelin ensiksi osia Murteenseuruukorpuksen äänitteistä ja luokittelin mainitun kaltaiset vokaalinetiset tapaukset, joissa konsonanttialkuisen sanan edellä odottaisi konsonantin kahdentumista, neljään eri luokkaan sen mukaan, onko tilanteessa äännetty pitkä glottaalisegmentti, lyhyt glottaaliklusiili, lyhyt narina vai täyskato. Lopputulos oli, että Murteenseuruukorpuksen paikkakunnilta kotoisin olevat 1980-luvulla syntyneet puhujat, Pälkänettä lukuun ottamatta, äänsivät nuo tilanteet nykyäänkin suunnilleen samoin kuin paikkakunnilla äännettiin vanhastaan Lauri Kettusen murrekartan mukaan. Länsi- ja kaakkoismurteissa esiintyi lähes yksinomaan täyttä katoa, savolaismurteissa esiintyi enemmän vaihtelua. Savolaismurteissa oli tilastollisesti merkitsevää se, että glottaaliklusiili jäi todennäköisemmin pois ennen että-sanaa kuin muualla. Analysoin työssä myös itse äänitettyä lukupuhuntaa akustisesti. Sotkamolainen ja pääkaupunkiseutulainen informantti lukivat ääneen tekstin, josta otettujen esimerkkien spektrogrammeja nähdään työssä. Molempien informanttien luennassa oli tyypillistä, että vokaalialkuisen ja vokaaliloppuisen sanan väliin jäi jonkin mittainen perustaajuudeton osuus, joko glottaaliklusiili tai narinaa. Perustaajuudettoman osuuden kesto rajageminaatiollisissa tapauksissa oli kummallakin informantilla sama (ei tilastollisesti merkitsevää eroa), mutta sotkamolaisella perustaajuudettomat osuudet rajageminaatiottomissa tapauksissa olivat keskimäärin lyhyempiä kuin pääkaupunkiseutulaisella puhujalla.
 • Tuominen, Jere (Helsingin yliopisto, 2022)
  This study has the intention of seeing whether Finnish English (FiE) resembles American (AmE) or British English (BrE) more. With that in mind, the two research questions focus on these two sides, first in what are the differences between BrE and AmE, as seen in written form data, and second in how these differences are seen in FiE in terms of which of the two FiE resembles more. Generally speaking, FiE has not been studied extensively and insofar as it has been studied, the current research is mostly been in more sociological domains, examining who use it and where and what is the status of English in Finland and so on. And with that in mind, this study has a more linguistic aim, in that by examining some unique aspects in AmE and BrE, I am trying to determine whether FiE aligns more with BrE or AmE. To do so, keywords and elements are gathered from literature (Algeo (2006) and Darragh (2000)) where differences have been observed. These differences are categorized into three larger groups: spellings, word forms (meaning single word differences larger than just spelling, for example, pronunciation, where meaning is still largely synomatic) and phrases and constructions (meaning multi-word formations). The key elements are first subjected to verification corpora, one in both variants to establish the characteristics and to discover how correct Darragh’s and Algeo’s estimation of differences truly are. When the differences have been established, three FiE corpora are used to likewise discover the same aspects in FiE. The results from FiE corpora are then compared with the results from BrE and AmE corpora to see possible similarities, connections, and differences between them. The results from the study are that at least the academic FiE was a lot like BrE. However, FiE had some aspects where in the tested sets BrE showed some unique characteristics, such as a strong influence of either French or Latin, and in these cases FiE did not resemble BrE, but was more akin to AmE. FiE does also share much of the modernized characteristics of AmE and when it came apparent that for any tested word or phrase a universal version was favored, FiE did not show any deviation from the larger variants. The probable reasoning behind ties with what was discovered in the background research, in the forementioned sociological studies, where the Finnish people had a highly pragmatic approach when it comes to their language use, and as such, it is to be expected that FiE is not simply an offspring of either of the two larger variants, but strives for the most understandable and modern style.
 • Tukiainen, Tommi (Helsingin yliopisto, 2020)
  Vallitsevan tieteeseen perustuvan uskomuksen mukaan ne englannin oppijat, joiden omissa äidinkielissään esiintyy vähän tai ei ollenkaan fraasiverbejä, välttävät fraasiverbien käyttöä englantia puhuessaan ja kirjoittaessaan englanti vieraana kielenä -kontekstissa. Tutkielmassani esitän holistisesti monimenetelmätutkimuksen keinoin vaihtoehtoisen näkemyksen, jonka mukaan verrattain vähäisempi fraasiverbien käyttö puheessa selittyy pikemminkin tietämättömyydestä ja vähäisestä altistuksesta, kuin tämän kielioppikategorian vastustamisesta. Tässä maisterintutkielmassa selvitän korpustutkimuksen keinoin pääasiallisesti suomalaisten lukiolaisten englannin oppijoiden fraasiverbien käyttöä suullisessa kokeessa, mutta tarkastelen myös suomalaisten 7.-luokkalaisten tuottamaa kieltä vertailun vuoksi. Käyttämäni suomalaiset korpukset ovat Hy-Talk ja FUSE. Vertaan suomalaisten englannin oppijoiden fraasiverbien käyttöä englantia äidinkielenään puhuvien isobritannialaisten nuorten fraasiverbien käyttöön. Vertailukorpuksena käytän BNC2014korpusta, josta rajasin aineistoa, jotta se olisi paremmin yhteensopiva suomalaisten korpusten kanssa niin koon kuin populaation osalta. Vertailemalla selvitän suomea ja englantia äidinkielenään puhuvien nuorten suullista fraasiverbien käyttöä rakenteellisesti, määrällisesti ja laadullisesti. Tavoitteenani on saada mahdollisimman kokonaisvaltainen kuva fraasiverbien käytöstä. Kun suomalaisesta korpusaineistosta saatua tietoa verrataan BNC2014-korpukseen, käy ilmi, että suomalaiset lukiolaiset englannin kielen oppijat käyttävät puheessaan keskimäärin huomattavasti vähemmän fraasiverbejä kuin englantia äidinkielenään puhuvat nuoret. Tämä ei kuitenkaan vielä tarkoita sitä, että suomalaisten englannin oppijoiden vähäisempi fraasiverbien käyttö selittyisi sillä, että fraasiverbejä vältettäisiin. Syitä verrattain vähäiseen fraasiverbien käyttöön voidaan löytää fraasiverbien opetuksesta ja vähäisestä altistuksesta. Tutkimalla Hy-Talkin sisältämää 7.-luokkalaisten englannin oppijoiden suullista tuottoa saadaan selville, että fraasiverbien käyttö kasvaa jyrkästi yläkoulun alusta lukioon. Fraasiverbien käyttö suullisessa koetilanteessa korreloi paremman kokonaisarvosanan kanssa. Vaikka suomalaisten englannin oppijoiden fraasiverbien käyttö on määrällisesti vähäisempää verrattuna natiiveihin, käyttämäni aineisto perustellusti vahvistaa näkemystä siitä, että oppimista tapahtuu ja suomalaiset englannin oppijat käyttävät fraasiverbejä parhaiden kykyjensä mukaan.
 • Könönen, Elena (Helsingfors universitet, 2017)
  Tässä työssä tutkin konnotaatiota eli sanan perusmerkitykseen liittyviä assosiatiivisia sivumerkityksiä, jotka vaikuttavat kielellisten ilmausten tyyliin ja tulkintaan. Työn teoreettisessa osassa tarkastelen mm. konnotaatioiden eri tyyppejä ja niiden funktiota ja käyttöä teksteissä. Tutkielmassa selvitän tarkemmin lintua tarkoittavien substantiivien konnotaatiota analysoimalla niiden käyttöä osana vertailurakennetta. Venäjän kielessä vertailun ilmaiseminen on mahdollista usealla eri tavalla, mutta tässä tutkimuksessa keskityn tarkastelemaan rakenteita, joissa lintua tarkoittava substantiivi esiintyy kak-konjunktiolla alkavassa vertailurakenteessa. Lisäksi tutkimus on rajattu niihin vertauksiin, jotka kuvaavat ihmisten käyttäytymistä ja ominaisuuksia. Tutkimusaineistona olen käyttänyt Venäjän kansalliskorpuksesta kokoamaani nykykieltä edustavaa aineistoa. Korpuksen semanttista annotaatiota hyödyntämällä selvitin ensiksi, mitä lintua tarkoittavia substantiiveja korpuksessa esiintyy, minkä jälkeen kokosin erillisillä hauilla kaikki vertailurakenteet, joissa esiintyy jokin 45 löytämästäni substantiivista. Työn teoriaosassa käsittelen seikkaperäisesti konnotaation eri lajeja ja pohdin mm. konnotaatioihin liittyvien emotionaalisten ja arvottavien merkitysten keskinäissuhdetta sekä konnotaatioiden suhdetta sanojen leksikaalisiin merkityksiin. Pääpaino on tyylillisissä konnotaatiossa, joihon liittyy usein myös kulttuurispesifejä piirteitä. Viimeksi mainitut heijastavat aikaisempien sukupolvien kokemuksia ja ajatusmaailmaa ja erityisen selvästi ne ilmenevät sananlaskuissa ja muissa kiteytyneissä ilmauksissa käytetyissä vertauksissa. Monet kielenkäytössä vakiintyneet vertaukset luetaan venäläisessä kielitieteessä fraseologian piiriin, mistä johtuen tarkastelen tutkimusaineistoa monin paikoin myös fraseologian oppien näkökulmasta. Tutkittaessa konnotaation käsitettä kansalliskulttuurisella tasolla käy ilmi, että konnotaatioita esiintyy kaikissa kielissä, mutta ne voivat erota toisistaan. Lintuihin liittyvät konnotaatiotkaan eivät ole kaikissa kielissä ja kulttuureissa yhteneväisiä, mistä johtuen niiden kääntäminen saattaa tuottaa hankaluuksia. Työn empiirisessä osassa analysoin korpusaineistosta esiin nousevia ilmiöitä sekä kvalitattivisesti että kvantitatiivisesti. Kvantitatiivista analyysiä edustaa mm. vertausten ideografinen ja syntaktinen luokittelu. Analyysi tuo esille mm. vapaiden ja kiteytyneiden vertausten välillä ilmeneviä yhtäläisyyksiä ja eroja. Korpusaineisto osoittaa, että lintuaiheisille vertauksille on tyypillistä niiden muuntautuminen ja että eri substantiivien välillä on suuria eroja niiden käytössä vertailurakenteessa. Aineiston perusteella tavallisimmpia lintuja, joihin ihmisiä verrataan venäläisessä kielenkäytössä, ovat kana, hanhi ja papukaija.
 • Huttunen, Kristian (Helsingfors universitet, 2016)
  Pro gradu -tutkielmani käsittelee venäjänkielisiä sopimuksia ja niiden kielellisiä erityispiirteitä korpuslingvistiikan menetelmiä käyttäen. Sopimustekstien tutkiminen korpuslingvistisin menetelmin ei ole kovin yleistä, mistä johtuen suoraan verrannollista aikaisempaa tutkimusta, johon tutkimustuloksia voisi verrata, ei ole saatavilla. Monet sopimusten erikoispiirteistä ovat myös virallisen asiatyylin erikoispiirteitä. Tutkielman lähtökohtana onkin hypoteesi, jonka mukaan sopimukset ovat virallisen asiatyylin alalaji. Tutkielmassa etsitään korpuslingvistisin menetelmin sellaisia venäjänkielisten sopimusten erikoispiirteitä, jotka voisivat tukea hypoteesia. Lisäksi esitellään myös muita sopimusten erikoispiirteitä ja muotoseikkoja. AntConc-ohjelman avulla etsitään sopimusten kaikkein käytetyimmät lekseemit ja N-grammit, joista voidaan tehdä johtopäätöksiä sopimusten ominaispiirteistä ja niiden esiintymisestä. Tutkimustulokset ovat pääosin kvantitatiivisia ja tutkielman kvalitatiiviset tulokset on johdettu niistä. Tutkimusaineistona käytetään mallisopimuksia, joista on muodostettu oma sopimuskorpus, Korpus dogovorov. Mallisopimukset toimivat oikeiden sopimusten pohjina, joten niissä on samoja erikoispiirteitä, kuin oikeissakin sopimuksissa. Lisäksi mallisopimukset ovat helpommin saatavilla, mikä mahdollistaa suuremman aineiston keruun ja kattavampien tutkimustulosten saamisen. Mallisopimukset eivät myöskään sisällä mitään oikeussubjektien salaisia tai henkilökohtaisia tietoja. Aineisto koostuu 735:stä mallisopimuksesta, jotka jakautuvat eri sopimustyyppeihin, kuten kauppasopimuksiin, edustussopimuksiin, vuokrasopimuksiin, työsopimuksiin jne. Aineistoon on pyritty keräämään mahdollisimman laaja kirjo eri sopimustyyppejä. Tutkielmassa perehdytään virallisen asiatyylin erikoispiirteisiin, erityisesti tyylillisiin piirteisiin. Tyylillisiä piirteitä ovat imperatiivisuus, tarkkuus, persoonan häivyttäminen eli persoonattomuus ja standardisoinnin korkea taso. Lisäksi perehdytään lähdekirjallisuudesta löytyviin sopimusten erikoispiirteisiin ja muotoseikkoihin. Tutkimusmetodeina käytetään korpuslingvistisien menetelmien tuottamia tilastollisia lukuja, joista keskeisimmät tässä tutkielmassa ovat absoluuttinen frekvenssi ja yhteisinformaatio MI (mutual information), joka mittaa kollokaatioiden osien todennäköisyyttä esiintyä yhdessä. Näitä menetelmiä hyödyntäen on koottu korpusten hallintaohjelmaa hyväksi käyttäen sopimusten käytetyimmät lekseemit ja N-grammit, jotka koostuvat 2-6:sta sanasta. 2-grammit on lajiteltu ryhmiin, mm. pääsanan ja määreen muodollisten suhteiden mukaan. Käytetyimpiä lekseemejä ja N-grammeja analysoimalla on tultu johtopäätökseen, että sopimukset ovat virallisen asiatyylin alalaji. Virallisen asiatyylin tyylilliset piirteet esiintyvät laajalti tutkimustuloksissa, mikä todistaa hypoteesin paikkansapitävyyden. Tutkimustulokset havainnollistavat myös muita sopimusten erikoispiirteitä, esimerkiksi verbien frekvenssi verrattuna substantiiveihin on normaalia pienempi. Tutkimustuloksista voidaan myös havaita, miten verbit korvataan lauseissa. Myös monet muut virallisen asiatyylin tyylillisten piirteiden ilmaisukeinot, samoin kuin muutkin virallisen asiatyylin ja sopimusten erikoispiirteet, esiintyvät tutkimusaineistossa, mutta niiden esiintyminen ei ole tarpeeksi toistuvaa, jotta ne näkyisivät käytetyimpien lekseemien ja N-grammien joukossa. Esimerkkinä voidaan mainita sopimusten leksikaaliset ja kieliopilliset poikkeamat kirjakielen normeista, joita esiintyy aineistossa. Tämän tutkielman merkittävin tuotos ovat massiiviset lekseemi- ja N-grammilistat, jotka itsessään kertovat paljon sopimusten erikoispiirteistä ja tarjoavat vastauksen kysymykseen, mitä lekseemejä ja kiinteitä sanaliittoja sopimuksissa esiintyy.
 • Salenius, Toni (Helsingin yliopisto, 2018)
  Tässä pro gradu -työssä tutkitaan sanojen johtamista kahden sanaparin (pitiful & piteous, poisonful & poisonous) tarkastelun kautta. Tutkimuksen konteksti on varhaisuusenglanti. Tutkimukselle asetetut tutkimuskysymykset kuuluvat: 1) Kuinka valittujen sanaparien käyttö muuttuu varhaismodernin englannin kauden aikana? ja 2) Vaikka sanaparien merkitys vaikuttaakin suhteessa toisiinsa samalta, onko niillä kuitenkin merkityseroja? Tämän työn aineistona käytetään Early English Books Online -korpusta. Tämä myös EEBOv3 korpukseksi kutsuttu tietokanta koostuu 44 422 korpustekstistä, joiden yhteenlaskettu sanamäärä on 1 202 214 511 sanaa. Korpuksen tekstit on koottu vuosien 1470 ja 1789 väliltä, ja ne sisältävät 4 713 326 eri sanatyyppiä. Suuri osa korpuksen teksteistä ovat tekstilajiltaan joko teologisia tai filosofisia. Tutkielmassa käytetty metodi on kaksiosainen. Ensimmäisessä osiossa metodina toimii kohdesanojen kvantitatiivinen tutkimus varhaisuusenglannin kauden ajalla. Toisessa osiossa tarkastellaan aluksi kymmentä yleisintä sanaparien kollokaatiota kvantitatiivisin menetelmin. Sen jälkeen tuloksia tarkastellaan kvalitatiivisen lähilukuanalyysin keinoin. Lähiluetut esimerkit on jaoteltu taksonomiaan, joka on luotu Oxford English Dictionary -sanakirjan luokittelujen avulla. Kummankin sanaparin kohdalla -FUL-johdosten käyttö väheni seuratun aikajakson edetessä. -OUS-johdokset olivat suositumpia kummankin sanaparin molempien sanojen esiintymisen ajan. Kollokaatioiden tutkimus osoitti, että sekä -FUL että -OUS -muotojen yhtenevistä määritelmistä huolimatta suurin osa parien kollokaatioista olivat eriäviä. Löydös antaa ymmärtää, että sanoja ei käytetä samoissa yhteyksissä, joten niiden merkitys ei voi olla täysin yhtäläinen. Tutkielman perusteella ehdotukseni jatkotutkimuksen kohteeksi on Early English Books Online -korpuksen tekstien tekstilajien tarkempi jaottelu ja niiden diakroninen tarkastelu. Arvokasta olisi myös tutkia -FUL ja -OUS-johdannaisia joko pidemmällä aikavälillä tai kenties nykyenglannissa.