Title: | Surveyaineiston editointi ja imputointi sovellettuna radonaltistusajan estimoinnissa |
Author: | Moisio, Sami |
Contributor organization: | University of Helsinki, Faculty of Social Sciences, Department of Mathematics and Statistics Helsingin yliopisto, Valtiotieteellinen tiedekunta, Matematiikan ja tilastotieteen laitos Helsingfors universitet, Statsvetenskapliga fakulteten, Matematiska och statistiska institutionen |
Date: | 2004-05-03 |
Language: | fin |
URI: | http://hdl.handle.net/10138/13724 |
Thesis level: | Master’s thesis |
Abstract: | Tutkielman tarkoituksena oli käydä läpi surveytutkimuksen erilaisia vaiheita ja esitellä surveytutkimuksen laatuun vaikuttavia osatekijöitä. Pääpaino tutkielmassa oli surveyaineiston editoinnissa ja imputoinnissa. Aineistona editoinnin ja imputointimenetelmien soveltamiseen käytännössä käytin Säteilyturvakeskuksen RATVA-tutkimusaineistoa. RATVA-tutkimuksessa selvitettiin suomalaisten altistumista radonsäteilylle keräämällä postikyselynä tietoja tutkimushenkilöiden ajankäytöstä. RATVA-tutkimuksen suurimmaksi ongelmaksi muodostui poikkeuksellisen laaja vastauskato. Puuttuvien havaintojen paikkaamiseen olen tutkielmassani käyttänyt erilaisia editointi- ja imputointimenetelmiä. Editointimenetelmistä kävin läpi editoinnin sääntöjä, editoinnin vaikutuksia ja roolia surveyprosessin parantamisessa. Imputointimenetelmistä käytin sekä perinteisiä että uusia menetelmiä esim. keskiarvoimputointi, hotdeck-imputointi ja regressioimputointi, moni-imputointi ja regressiopohjainen lähimmän naapurin hotdeck-imputointimenetelmä. Surveyaineiston laatuun vaikuttavista osatekijöistä käsittelin tarkkuutta, relevanssia sekä harhan lähteitä, erityisesti yksikkö- ja erävastauskatoa. Lisäksi tavoitteena oli arvioida mahdollisia syitä RATVA-tutkimuksen suureen vastauskatoon ja arvioida erilaisia keinoja vastauskadon välttämiseen jatkossa toteutettavissa vastaavanlaisissa surveytutkimuksissa. Surveytutkimuksen kyselylomakkeen suunnittelulla voidaan vähentää imputoinnin tarvetta ja pienentää vastauskadon määrää. Pitkät ja vastaajan kannalta raskaat kysymyspatterit lisäävät yksikkövastauskatoa sekä heikentävät aineiston laatua lisäämällä erävastauskatoa. Lyhyemmät ja vastaajalle selvemmät kyselylomakkeet puolestaan lisäävät vastanneiden osuutta ja vähentävät erävastauskadon määrää. Editointimenetelmillä pystyttiin huomattavasti parantamaan RATVA-aineiston laatua ja tilanteeseen sopivilla imputointimenetelmillä voitiin kasvattaa aineiston kokoa niin, että tulokset saatiin vastaamaan suuremman aineiston tuloksia. Tämän tutkielman pohjalta en suosittelisi keskiarvoimputoinnin käyttöä. Keskiarvoimputointi pienentää keinotekoisesti hajontaa antaen harhaan johtavan vaikutelman siitä, että arviot olisivat erittäin tarkkoja. Hotdeck-imputointimenetelmät ja muut aitoon luovuttajaan perustuvat imputoinnit ovat hyviä, koska ne eivät aliestimoi hajontaa, ja imputointiarvot tulevat valituiksi aineiston aitojen havaintojen joukosta, aidoilta luovuttajilta. Imputoituja ja imputoimattomia ajankäyttötuloksia on myös verrattu Tilastokeskuksen tekemän ajankäyttötutkimuksen tuloksiin. Näin on saatu mukaan ulkopuolinen vertailukohde RATVA-tutkimusaineistosta lasketuille ajankäyttötiedoille. Editoimalla ja imputoimalla voidaan parantaa suuresta erä- ja yksikkövastauskadosta kärsivän surveyaineiston laatua. Haittana on se, että editointiin ja imputointiin kuluu paljon rahaa ja aikaa, eikä etukäteen voida tarkasti tietää, kuinka paljon surveyaineiston laatua todella voidaan parantaa editoinnin ja imputoinnin avulla. Tutkielman tärkeimmät lähteet olivat: Groves, Robert, Dillman, Don, Eltinge, John, Little, Roderick (2002). Survey Nonresponse. First edition. Wiley Interscience Publication, New York. Kovar, John, Rancourt, Eric (2003). Workshop on editing and imputation of survey data. IASS and Statistics Canada. Laaksonen, Seppo (2002). Survey metodologia. Helsingin yliopiston tilastotieteen laitoksen syksyn 2002 kurssin luentomateriaali. Nordbotten, Svein (1999). ”Strategies for improving statistical quality”. http://www.unece.org/stats/. Haettu lokakuussa 2003. |
Description: | Only abstract. Paper copies of master’s theses are listed in the Helka database (http://www.helsinki.fi/helka). Electronic copies of master’s theses are either available as open access or only on thesis terminals in the Helsinki University Library. Vain tiivistelmä. Sidottujen gradujen saatavuuden voit tarkistaa Helka-tietokannasta (http://www.helsinki.fi/helka). Digitaaliset gradut voivat olla luettavissa avoimesti verkossa tai rajoitetusti kirjaston opinnäytekioskeilla. Endast sammandrag. Inbundna avhandlingar kan sökas i Helka-databasen (http://www.helsinki.fi/helka). Elektroniska kopior av avhandlingar finns antingen öppet på nätet eller endast tillgängliga i bibliotekets avhandlingsterminaler. |
Subject: |
survey
editointi imputointi vastauskato ajankäyttötutkimus |
Total number of downloads: Loading...
Files | Size | Format | View |
---|---|---|---|
abstract.pdf | 49.44Kb |
View/ |