Surveyaineiston editointi ja imputointi sovellettuna radonaltistusajan estimoinnissa

Show full item recordPermalink

http://hdl.handle.net/10138/13724
Title: Surveyaineiston editointi ja imputointi sovellettuna radonaltistusajan estimoinnissa
Author: Moisio, Sami
Contributor organization: University of Helsinki, Faculty of Social Sciences, Department of Mathematics and Statistics
Helsingin yliopisto, Valtiotieteellinen tiedekunta, Matematiikan ja tilastotieteen laitos
Helsingfors universitet, Statsvetenskapliga fakulteten, Matematiska och statistiska institutionen
Date: 2004-05-03
Language: fin
URI: http://hdl.handle.net/10138/13724
Thesis level: Master’s thesis
Abstract: Tutkielman tarkoituksena oli käydä läpi surveytutkimuksen erilaisia vaiheita ja esitellä surveytutkimuksen laatuun vaikuttavia osatekijöitä. Pääpaino tutkielmassa oli surveyaineiston editoinnissa ja imputoinnissa. Aineistona editoinnin ja imputointimenetelmien soveltamiseen käytännössä käytin Säteilyturvakeskuksen RATVA-tutkimusaineistoa. RATVA-tutkimuksessa selvitettiin suomalaisten altistumista radonsäteilylle keräämällä postikyselynä tietoja tutkimushenkilöiden ajankäytöstä. RATVA-tutkimuksen suurimmaksi ongelmaksi muodostui poikkeuksellisen laaja vastauskato. Puuttuvien havaintojen paikkaamiseen olen tutkielmassani käyttänyt erilaisia editointi- ja imputointimenetelmiä. Editointimenetelmistä kävin läpi editoinnin sääntöjä, editoinnin vaikutuksia ja roolia surveyprosessin parantamisessa. Imputointimenetelmistä käytin sekä perinteisiä että uusia menetelmiä esim. keskiarvoimputointi, hotdeck-imputointi ja regressioimputointi, moni-imputointi ja regressiopohjainen lähimmän naapurin hotdeck-imputointimenetelmä. Surveyaineiston laatuun vaikuttavista osatekijöistä käsittelin tarkkuutta, relevanssia sekä harhan lähteitä, erityisesti yksikkö- ja erävastauskatoa. Lisäksi tavoitteena oli arvioida mahdollisia syitä RATVA-tutkimuksen suureen vastauskatoon ja arvioida erilaisia keinoja vastauskadon välttämiseen jatkossa toteutettavissa vastaavanlaisissa surveytutkimuksissa. Surveytutkimuksen kyselylomakkeen suunnittelulla voidaan vähentää imputoinnin tarvetta ja pienentää vastauskadon määrää. Pitkät ja vastaajan kannalta raskaat kysymyspatterit lisäävät yksikkövastauskatoa sekä heikentävät aineiston laatua lisäämällä erävastauskatoa. Lyhyemmät ja vastaajalle selvemmät kyselylomakkeet puolestaan lisäävät vastanneiden osuutta ja vähentävät erävastauskadon määrää. Editointimenetelmillä pystyttiin huomattavasti parantamaan RATVA-aineiston laatua ja tilanteeseen sopivilla imputointimenetelmillä voitiin kasvattaa aineiston kokoa niin, että tulokset saatiin vastaamaan suuremman aineiston tuloksia. Tämän tutkielman pohjalta en suosittelisi keskiarvoimputoinnin käyttöä. Keskiarvoimputointi pienentää keinotekoisesti hajontaa antaen harhaan johtavan vaikutelman siitä, että arviot olisivat erittäin tarkkoja. Hotdeck-imputointimenetelmät ja muut aitoon luovuttajaan perustuvat imputoinnit ovat hyviä, koska ne eivät aliestimoi hajontaa, ja imputointiarvot tulevat valituiksi aineiston aitojen havaintojen joukosta, aidoilta luovuttajilta. Imputoituja ja imputoimattomia ajankäyttötuloksia on myös verrattu Tilastokeskuksen tekemän ajankäyttötutkimuksen tuloksiin. Näin on saatu mukaan ulkopuolinen vertailukohde RATVA-tutkimusaineistosta lasketuille ajankäyttötiedoille. Editoimalla ja imputoimalla voidaan parantaa suuresta erä- ja yksikkövastauskadosta kärsivän surveyaineiston laatua. Haittana on se, että editointiin ja imputointiin kuluu paljon rahaa ja aikaa, eikä etukäteen voida tarkasti tietää, kuinka paljon surveyaineiston laatua todella voidaan parantaa editoinnin ja imputoinnin avulla. Tutkielman tärkeimmät lähteet olivat: Groves, Robert, Dillman, Don, Eltinge, John, Little, Roderick (2002). Survey Nonresponse. First edition. Wiley Interscience Publication, New York. Kovar, John, Rancourt, Eric (2003). Workshop on editing and imputation of survey data. IASS and Statistics Canada. Laaksonen, Seppo (2002). Survey metodologia. Helsingin yliopiston tilastotieteen laitoksen syksyn 2002 kurssin luentomateriaali. Nordbotten, Svein (1999). ”Strategies for improving statistical quality”. http://www.unece.org/stats/. Haettu lokakuussa 2003.
Description: Only abstract. Paper copies of master’s theses are listed in the Helka database (http://www.helsinki.fi/helka). Electronic copies of master’s theses are either available as open access or only on thesis terminals in the Helsinki University Library.Vain tiivistelmä. Sidottujen gradujen saatavuuden voit tarkistaa Helka-tietokannasta (http://www.helsinki.fi/helka). Digitaaliset gradut voivat olla luettavissa avoimesti verkossa tai rajoitetusti kirjaston opinnäytekioskeilla.Endast sammandrag. Inbundna avhandlingar kan sökas i Helka-databasen (http://www.helsinki.fi/helka). Elektroniska kopior av avhandlingar finns antingen öppet på nätet eller endast tillgängliga i bibliotekets avhandlingsterminaler.
Subject: survey
editointi
imputointi
vastauskato
ajankäyttötutkimus


Files in this item

Total number of downloads: Loading...

Files Size Format View
abstract.pdf 49.44Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record