Yliopiston etusivulle Suomeksi På svenska In English Helsingin yliopisto

Kadon ongelman ratkaisukeinoja

Show simple item record

dc.contributor Helsingin yliopisto, Matematiikan ja tilastotieteen laitos (Valtiotieteellinen tiedekunta) fi
dc.contributor University of Helsinki, Mathematics and Statistics (Faculty of Social Sciences) en
dc.contributor Helsingfors universitet, Matematik och statistik, Institutionen för (Statsvetenskapliga fakulteten) sv
dc.contributor.author Valaste, Maria
dc.date.accessioned 2009-09-08T09:24:36Z
dc.date.available 2009-09-08T09:24:36Z
dc.date.issued 2004-09-20 en
dc.identifier.uri http://hdl.handle.net/10138/10163
dc.description Endast avhandlingens sammandrag. Pappersexemplaret av hela avhandlingen finns för läsesalsbruk i Statsvetenskapliga biblioteket (Unionsgatan 35). Dessa avhandlingar fjärrutlånas endast som microfiche. sv
dc.description Abstract only. The paper copy of the whole thesis is available for reading room use at the Library of Social Sciences (Unioninkatu 35) . Microfiche copies of these theses are available for interlibrary loans. en
dc.description Vain tiivistelmä. Opinnäytteiden sidotut arkistokappaleet ovat luettavissa HY:n keskustakampuksen valtiotieteiden kirjastossa (Unioninkatu 35). Opinnäytteitä lainataan ainoastaan mikrokortteina kirjaston kaukopalvelun välityksellä fi
dc.description.abstract Tutkielman teoriaosassa esitellään ensin kadon ongelmaan liittyvät keskeiset käsitteet. Tämän jälkeen käydään läpi erityyppisiin kadon mekanismeihin soveltuvia menetelmiä sekä laskennallisena apukeinona paneudutaan EM-algoritmiin ja sen toimivuuteen. Sivuutettavissa olevan kadon menetelminä esitellään rajoitetun aineiston analyysi, havaintojen painottaminen ja imputointi. Rajoitetun aineiston analyyseinä käsitellään kokonaisten tapausten analyysiä, joka on ohjelmistopakettien yleisin vaihtoehto puuttuvan tiedon käsittelyyn sekä tarkastellaan myös saatavilla olevien tapausten analyysiä. Havaintojen painottamiseksi esitellään ensin yleisesti Horvitz-Thompson tyyppisen estimaattorin muodostamista ja tämän jälkeen osallistumistodennäköisyyden estimoimista sekä lopuksi painokertoimien muodostamista pitkittäisaineistolle. Imputointimenetelminä tarkastellaan keskiarvo-, ehdollisella keskiarvolla, regressio-, hot deck- ja cold deck –imputointia sekä moni-imputointia. Informatiivisen kadon hallintaan esitellään kaksi uskottavuusfunktiosta faktoroimalla saatavaa mallia: valikoitumismalli ja katotyyppien sekoitusmalli. Tutkielman empiirisessä osassa tarkastellaan tamperelaisista nuorista koostuvaa pitkittäisaineistoa. Aineiston on kerätty Kansanterveyslaitoksessa (Mielenterveyden ja alkoholitutkimuksen osasto) ja Tampereen yliopistossa (Terveystieteiden laitos) vuosina 1983,1989 ja 1999. Työssä mallitetaan nuoren aikuisen masentuneisuutta (Beck Depression Inventory) 22- ja 32-vuoden ikäisenä ja tutkitaan puuttuvien vastausten vaikutusta depression estimointiin. Erävastauskadon korjaamiseen käytettiin moni-imputointia. Aineisto paikattiin käyttäen Amelia ohjelmaa imputointikertojen lukumäärällä viisi. Masennusta kuvaavat mallit muodostettiin sekä kokonaisten tapausten analyysillä että imputoiduilla aineistoilla. Moni-imputoinnin tulosten yhdistämisen jälkeen kokonaisten tapausten analyysin ja moni-imputoinnin tuloksia vertailtiin tilastollisten tunnuslukujen mm. estimaattien, keskivirheiden ja luottamusvälien osalta. Saadut tulokset eivät juuri poikenneet toisistaan. Luottamusvälit olivat hieman kapeammat moni-imputoinnilla saaduille malleille. Tämä ei ollut yllättävää, sillä erävastauskadon määrä oli vähäinen. Malleille suoritetut diagnostiset tarkastelut eivät osoittaneet mitään jatkotoimenpiteitä vaativaa. Ennustemallissa masentuneisuudelle 22-vuotiaana selittäjinä olivat psykosomaattisten oireiden ja itsetunnon mittarit 16-vuotiaana. Malli 32-vuotiaille sisälsi selittäjinä psyykkisten oireiden, itsetunnon ja masentuneisuuden mittarit 22-vuotiaana. Imputointimallia muodostettaessa mielenkiintoinen havainto oli, että katoon liittyvät muuttujat eivät olleet tilastollisesti merkitseviä mallinnettavien muuttujien kannalta. Tutkielman keskeisimmät lähteet ovat Little ja Rubin (2002): Statistical analysis with missing data, Second Edition, Wiley, New York ja Sovio ja Läärä (2002): Puuttuvan datan ongelma ja sen ratkaisukeinoja terveystutkimuksissa, Sosiaalilääketieteellinen aikakauslehti: 39, 312-325. en
dc.language.iso fi en
dc.subject puuttuvan tiedon käsittely en
dc.subject vastauskato - eräkato en
dc.subject moni-imputointi en
dc.subject masentuneisuuden mallintaminen en
dc.title Kadon ongelman ratkaisukeinoja en
dc.identifier.laitoskoodi 710 en
dc.type.ontasot Master's thesis en
dc.type.ontasot Pro gradu fi
dc.type.ontasot Pro gradu sv

Files in this item

Files Description Size Format View/Open
abstract.pdf 50.39Kb PDF View/Open
This item appears in the following Collection(s)

Show simple item record

Search Helda


Advanced Search

Browse

My Account