Browsing by Subject "keywords"

Sort by: Order: Results:

Now showing items 1-2 of 2
  • Pitkämäki, Arla-Maria (Helsingfors universitet, 2016)
    Tässä pro gradu -tutkielmassa analysoin mies- ja naiselokuvaohjaajista käytävää diskurssia, kuinka heitä kuvaillaan ja esitellään mediateksteissä. Työ perustuu korpuslingvistiikan tutkimusmetodeihin ja tutkimuskohteena on sanasto. Työn tavoitteena on tutkia, löytyykö mies- ja naiselokuvaohjaajien biografioista eroavaisuuksia tekstin painotuksissa ja käsiteltävissä aiheissa ja mitkä nämä mahdolliset erot ovat. Lisäksi tarkoituksena on analysoida muita mahdollisesti esiin nousevia mielenkiintoisia havaintoja. Tutkimusaineistona käytän Wikipediasta, Internet Movie Database -sivustolta ja Rotten Tomatoes -sivustolta kerättyjä ohjaajien biografioita. Valittuja ohjaajia on yhteensä 30 naisohjaajaa ja 30 miesohjaajaa, joista 15 on valittu Yhdysvaltojen lippukassatulojen ja 15 arvostelumenestyksen perusteella. Mieselokuvaohjaajien korpus koostuu 90 biografiasta ja naiselokuvaohjaajien korpus 85 biografiasta. Naisten asema elokuva-alalla on tunnetusti heikko. Vuonna 2015 vain 19% kulissien takana työskentelevistä työntekijöistä oli Yhdysvaltojen 250 parhaiten menestyneessä elokuvassa naisia, ja vain 9% näistä elokuvista oli naisten ohjaamia. Myös naishahmojen, varsinkin pääroolien, edustavuus valkokankailla on huono verrattuna mieshahmoihin. Naisten heikko asema elokuva-alalla on viime aikoina saanut runsaasti huomiota julkisuudessa. Työssä käytän korpuslingvistiikan tutkimusmetodeja: frekvenssejä, avainsanoja ja kollokaatiota. Vertailen mies- ja naiselokuvaohjaajien biografioissa esiintyvää työhön ja perhe-elämään liittyvää sanastoa, samoin vertailen avainsanoja näiden biografioiden kesken ja vertailen eniten esiintyviä adjektiiveja ja tutkin mies + ohjaaja -sanojen ja nais + ohjaaja -sanojen kollokaatiota. Viitekehyksenä työlle toimii kielitieteellinen naistutkimus. Mies- ja naiselokuvaohjaajista käytävä diskurssi osoittautuu erilaiseksi. Perheen rooli korostuu naiselokuvaohjaajista puhuttaessa huomattavasti enemmän kuin mieselokuvaohjaajista puhuttaessa. Naiselokuvaohjaajista puhuttaessa myös sukupuoli tuntuu korostuvan. Tästä kertoo esimerkiksi se, että naisohjaaja on useasti käytetty termi, toisin kuin miesohjaaja, joka ei esiinny kertaakaan biografioissa. Mieselokuvaohjaajien biografioissa esiintyy selkeästi enemmän työhön liittyvää sanastoa ja varsinkin työhön liittyvää teknillistä sanastoa. Eri korpuslingvistiset tutkimusmenetelmät tarkastelevat aineistoa eri lähtökohdista, mutta tulokset ovat varsin samansuuntaiset. Tutkimustulokset osoittavat nais- ja mieselokuvaohjaajista käytävässä diskurssissa naisen roolin perheen kasvattajana korostuvan vanhanaikaisella tavalla. Naiselokuvaohjaajista käytävä diskurssi myös korostaa sitä, kuinka poikkeavia naiselokuvaohjaajat ovat vielä tällä varsin miesvaltaisella alalla. Jotta tämä asiantila voisi muuttua, on tärkeää huomata diskurssien eroavaisuus, sillä diskursseilla on paljon valtaa.
  • Lijffijt, Jefrey; Nevalainen, Terttu; Säily, Tanja; Papapetrou, Panagiotis; Puolamäki, Kai; Mannila, Heikki (2016)
    Finding out whether a word occurs significantly more often in one text or corpus than in another is an important question in analysing corpora. As noted by Kilgarriff (Language is never, ever, ever, random, Corpus Linguistics and Linguistic Theory, 2005; 1(2): 263–76.), the use of the X2 and log-likelihood ratio tests is problematic in this context, as they are based on the assumption that all samples are statistically independent of each other. However, words within a text are not independent. As pointed out in Kilgarriff (Comparing corpora, International Journal of Corpus Linguistics, 2001; 6(1): 1–37) and Paquot and Bestgen (Distinctive words in academic writing: a comparison of three statistical tests for keyword extraction. In Jucker, A., Schreier, D., and Hundt, M. (eds), Corpora: Pragmatics and Discourse. Amsterdam: Rodopi, 2009, pp. 247–69), it is possible to represent the data differently and employ other tests, such that we assume independence at the level of texts rather than individual words. This allows us to account for the distribution of words within a corpus. In this article we compare the significance estimates of various statistical tests in a controlled resampling experiment and in a practical setting, studying differences between texts produced by male and female fiction writers in the British National Corpus. We find that the choice of the test, and hence data representation, matters. We conclude that significance testing can be used to find consequential differences between corpora, but that assuming independence between all words may lead to overestimating the significance of the observed differences, especially for poorly dispersed words. We recommend the use of the t-test, Wilcoxon rank sum test, or bootstrap test for comparing word frequencies across corpora.