Bayesian regularized regression methods for quantitative genetics with focus on longitudinal data

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-951-51-0076-4
Title: Bayesian regularized regression methods for quantitative genetics with focus on longitudinal data
Author: Li, Zitong
Contributor: University of Helsinki, Faculty of Science, Department of Mathematics and Statistics
Publisher: Helsingin yliopisto
Date: 2014-10-03
URI: http://urn.fi/URN:ISBN:978-951-51-0076-4
http://hdl.handle.net/10138/135863
Thesis level: Doctoral dissertation (article-based)
Abstract: Quantitative trait loci (QTL) /association mapping aims to identify the genomic loci associated with the complex traits. From a statistical perspective, multiple linear regression is often used to model, estimate and test the effects of molecular markers on a trait. With genotype data derived from contemporary genomics techniques, however, the number of markers typically exceed the number of individuals, and it is therefore necessary to perform some sort of variable selection or parameter regularization to provide reliable estimates of model parameters. In addition, many quantitative traits are changing during their development process of life. Accordingly, a longitudinal study that jointly maps the repeated measurements of the phenotype over time may increase the statistical power to identify QTLs, compared with the single trait analysis. In this thesis, a series of Bayesian variable selection/regularization linear methods were developed and applied for analyzing quantitative traits measured at either single or multiple time points. The first work provided an overview of the principal frequentist regularization methods for analyzing single traits. The second work also focused on single trait analysis, where a variational Bayesian (VB) algorithm was derived for estimating parameters in several Bayesian regularization methods. The VB methods can be quickly implemented on large data sets in contrast to the classical Markov Chain Monte Carlo methods. In the third work, the Bayesian regularization method was extended to a non-parametric varying coefficient model to analyze longitudinal traits. Particularly, an efficient VB stepwise algorithm was used for variable selection, so that the method can be quickly implemented even on data sets with a large number of time points and/or a large number of markers. The fourth work is an application of variable selection methods on forest genetics data collected from Northern Sweden. From several conifer wood properties traits with multiple time points, four QTLs located at genes were identified, which are promising targets for future research in wood molecular biology and breeding.Eri organismeilla pituus ja paino ovat tyypillisiä ilmiasuja eli fenotyyppejä, joita voidaan mitata luonnossa. Lisäksi molekyylibiologia tarjoaa menetelmät yksilön genotyypin määrittämiseen DNA sekvenssistä. Yleisesti uskotaan että perinnölliset tekijät vaikuttavat monien ominaisuuksien fenotyyppeihin. Siksi yhteyden löytäminen perinnöllisten tekijöiden ja tietyn fenotyypin välille on kiinnostava tieteellinen kysymys. Esimerkiksi kasvi- ja eläintieteessä, tällaista tutkimusta käytetään ruuan tuotannon parantamiseen. Yksinkertaisimmassa tapauksessa, yksittäinen geenikohta (tietty pätkä DNA:ta) voi täysin määrätä kaksiarvoisen fenotyypin tilan. Tämä voidaan helposti osoittaa käyttämällä yksinkertaisia todennäköisyyssääntöjä. Monet jatkuvat ominaisuudet ovat kuitenkin monitekijäisiä siten että niiden taustalla on useita geenejä ja ympäristöllisiä tekijöitä. Monitekijäisten ominaisuuksien analysointiin on siksi käytettävä edistyneempiä tilastollisia menetelmiä kuten lineaarista regressiota. Tässä väitöskirjassa on kehitetty useita moderneja lineaarimalleihin pohjautuvia tekniikoita geenikohtien paikantamiseksi. Lisäksi työssä analysoitiin ruotsalainen metsätieteeseen liittyvä geneettinen aineisto jossa löydettiin neljä uutta geenikohtaa joidenka toimintaa voidaan myöhemmin tutkia tarkemmin.
Subject: statistics
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
bayesian.pdf 750.5Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record