Adjustment for Covariate Measurement Errors in Complex Surveys: A Simulation Study of Three Competing Methods

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-951-51-0846-3
Title: Adjustment for Covariate Measurement Errors in Complex Surveys: A Simulation Study of Three Competing Methods
Author: Valaste, Maria
Contributor: University of Helsinki, Faculty of Social Sciences, Department of Social Research
Publisher: Helsingin yliopisto
Date: 2015-03-27
URI: http://urn.fi/URN:ISBN:978-951-51-0846-3
http://hdl.handle.net/10138/153562
Thesis level: Doctoral dissertation (monograph)
Abstract: In sample surveys, the uncertainty of parameter estimates comes from two main sources: sampling and measuring the study units. Some aspects of survey errors are quite well understood (e.g. sampling errors, nonresponse errors) and reported but others, like measurement errors, are often neglected. This thesis studies measurement uncertainty in covariates. Focus is on the adjustment for covariate measurement errors in logistic regression for cluster-correlated data. Three methods for adjustment for covariate measurement errors in surveys are studied. The methods are Maximum Likelihood, Multiple Imputation and Regression Calibration. These methods require information obtained from validation study. The thesis consists of a theoretical part and extensive Monte Carlo simulation experiments. At the first simulation experiment, the simulation study is conducted with artificial data and with independent observations to test and have experience of the three methods: MI, ML and RC. The second and third simulation study is performed with cluster-correlated data. In these simulation studies, the first simulation uses artificial data and the latter uses real data. In both simulations regression calibration and multiple imputation approaches are examined in various simulation designs. The quality of the methods is assessed by the bias and accuracy. The bias is measured by absolute relative bias percentages (ARB%) and the accuracy by relative root mean-squared error percentages (RRMSE%). The results suggest that additional information from validation (calibration) data enables more accurate estimates in terms of bias percentages.Väitöskirjassa tarkastellaan mittausvirheitä. Epätarkat mittaukset ja niistä johtuvat mittausvirheet ovat tutkimuksessa yleisiä. Jos mittauksen epävarmuus jätetään huomioimatta, voidaan päätyä harhaisiin tuloksiin ja näin ollen virhepäätelmiin. Väitöskirjan alkuosassa käsitellään mittausvirheisiin liittyvää teoriaa ja loppuosassa on kolme simulointikoetta. Työssä tutkitaan ja vertaillaan kolmen menetelmän toimivuutta mittausvirheiden huomioimiseksi. Tarkasteltavat menetelmät ovat regressiokalibrointi, moni-imputointi ja suurimman uskottavuuden menetelmä. Menetelmien käyttämiseksi tarvitaan lisätietoa mittausvirheestä. Lisätieto saadaan validointidatasta. Menetelmien toimivuutta tarkastellaan simulointikokeissa. Ensimmäisessä simulointikokeessa havaintojen oletetaan olevan riippumattomia ja kahdessa jälkimmäisessä simulointikokeessa havainnot ovat sisäkorreloituneita. Mittausvirheitä tarkastellaan logistisen mallin ja logistisen sekamallin yhteydessä. Vastemuuttuja oletetaan kaksiarvoikseksi ja sen ei oleteta sisältävän mittausvirhettä. Osa mallin selittäjistä sisältää mittausvirhettä, mutta mallissa voi myös olla selittäjiä, joissa ei ole mittausvirhettä. Oletetaan, että ainakin osalle havainnoista on saatavissa tarkasti mitatut vastineet. Erityisesti mielenkiinnon kohteena on tilanne, jossa mallinnettava aineisto on sisäkorreloitunut. Tällainen on tyypillistä mm. kotitalousaineistoissa, joissa poimintatapa tuottaa sisäkorreloituneisuutta aineistoon. Tavoitteena kaiken kaikkiaan on estimoida malli niin hyvin kuin mahdollista. Kaksi ensimmäistä simulointikoetta on malliperusteisia ja aineisto on muodostettu tilastollisella mallilla. Tämä mahdollistaa menetelmien tilastollisten ominaisuuksien vertailun täysin kontroloidussa asetelmassa. Kolmas simulointikoe on asetelmaperusteinen ja aineistona käytetään ECHP-aineistoa (European Community Household Panel). Menetelmien vertailuun käytetään ARB % (absolute relative bias percentages) ja RRMSE % (relative root mean-squared error percentages) lukuja. Ensimmäisen simulointikokeen mukaan moni-imputointi ja regressiokalibrointi olivat laskennallisesti helppoja taasen suurimman uskottavuuden menetelmä osoittautui laskennallisesti työlääksi. Kahdessa jälkimmäisessä simulointikokeessa vertailtiin moni-imputointia ja regressiokalibrointia. Simulointikokeiden mukaan validointidatan sisältämän lisätiedon hyödyntäminen parantaa tuloksia niin riippumattomien havaintojen tilanteessa kuin sisäkorreloituneen aineiston yhteydessä.
Subject: tilastotiede
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
adjustme.pdf 1.180Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record