Yliopiston etusivulle Suomeksi På svenska In English Helsingin yliopisto

On the superior power of likelihood-based linkage disequilibrium mapping in large multiplex families compared to population based case-control designs

Show full item record

Files in this item

Files Description Size Format View/Open
onthesup.pdf 8.163Mb PDF View/Open
Use this URL to link or cite this item: http://urn.fi/URN:ISBN:978-952-245-713-4
Vie RefWorksiin
Title: On the superior power of likelihood-based linkage disequilibrium mapping in large multiplex families compared to population based case-control designs
Author: Hiekkalinna, Tero
Contributor: University of Helsinki, Faculty of Medicine, Haartman Institute, Medical GeneticsInstitute for Molecular Medicine Finland FIMM, Helsinki, FinlandPublic Health Genomics Unit, National Institute for Health and Welfare, Helsinki, Finland
Thesis level: Doctoral dissertation (article-based)
Belongs to series: URN:ISSN:1798-0062
Abstract: In this thesis, we developed software for automated genome-wide linkage and linkage disequilibrium analysis based on common gene mapping methods for qualitative and quantitative phenotypes. We further developed likelihood-based software for joint linkage and/or linkage disequilibrium (LD) analysis in general pedigrees based on a novel variation of the classical lod score approach, the so-called pseudomarker method, and evaluated its statistical properties as compared with the existing family-based association methods. This was done using real-life migraine and schizophrenia pedigree structures from Finland. In addition, we compared various study designs for association analysis and investigated statistical properties of the likelihood ratio test for conditional analysis of LD given linkage.

First, we automated the laborious process of running a variety of genome-wide linkage and linkage disequilibrium analysis software packages, including ANALYZE, MERLIN, GENEHUNTER, and SOLAR. With this software tool, data file format conversion, and running of the analyses are completely automated. This tool has been applied to many large genome-wide mapping studies.

Second, we developed user-friendly PSEUDOMARKER software, which performs likelihood-based linkage and/or linkage disequilibrium analysis in general pedigrees. This software allows for joint analysis of heterogeneous relationship structures, such as singletons (i.e. cases and controls), triads, sibships, and large multigenerational pedigrees. The performance of this software was evaluated in comparison to the existing repertoire of other family-based association methods.

Third, we performed an extensive simulation study to investigate the statistical properties (i.e. type-I error and power) of PSEUDOMARKER and other commonly used family-based association methods. Our results demonstrate that many widely-used methods are not valid for testing LD in the presence of linkage, and likelihood-based methods which can properly account for missing data and individual relationships in pedigrees, such as PSEUDOMARKER, outperform the other approaches over a wide variety of etiological models. We also demonstrated that association mapping in families is far more powerful than in population-based samples.

Fourth, we investigated the statistical properties of the likelihood ratio test for association conditional on linkage when inaccurate parametric models were used. Our results showed that while under most situations they perform appropriately despite the parametric model being improperly specified, under certain conditions, when there is complete linkage between disease and marker loci, overly-deterministic dominant analysis models can lead to false inferences of LD in the presence of linkage when the true etiological model is recessive in character.

In this study, we have developed powerful and easy to use tools for analysis of linkage and LD in general pedigrees and unrelated individuals jointly, and have demonstrated the superiority of such methods in the general case. Our results provide important information for the human genetics community about optimal ways to collect and analyze data.Tässä väitöskirjatutkimuksessa kehitettiin menetelmä koko perimänlaajuiseen automaattiseen kytkentä- ja kytkentäepätasapainoanalyysiin kvalitatiivisilla ja kvantitatiivisilla ominaisuuksilla käyttäen yleisiä geenikartoitusmenetelmiä. Lisäksi tässä työssä kehitettiin uskottavuuteen perustuva tietokoneohjelma yhdistettyyn kytkentä- ja kytkentäepätasapainoanalyysiin perheaineistossa, joka perustuu muunnelmaan klassisesta lod score kytkentäanalyysimenetelmästä. Tämän ns. pseudomarker-menetelmän tilastotieteellisiä ominaisuuksia verrattiin simulaatiotutkimuksella muihin yleisesti käytettyihin perhepohjaisiin assosiaatiomenetelmiin käyttäen suomalaisia skitsofrenia ja migreeni perherakenteita. Lisäksi vertailtiin erilaisia tutkimusasetelmia assosiaatioanalyysissä ja tutkittiin ehdollisen uskottavuusosamäärätestin tilastotieteellisiä ominaisuuksia, kun testataan assosiaatiota kytkennän vallitessa

Ensimmäisessä osatyössä automatisoitiin koko perimänlaajuinen kytkentä- ja kytkentäepätasapainoanalyysi käyttäen ANALYZE, MERLIN, GENEHUNTER ja SOLAR geenikartoitusohjelmia. Tämän tietokoneohjelman avulla aineiston käsittely geenikartoitusmenetelmän vaatimaan muotoon ja analyysi on täysin automatisoitu. Lisäksi se on mahdollistanut useita automatisoituja laajoja koko perimänlaajuisia geenikartoitusanalyysejä.

Toisessa osatyössä kehitettiin käyttäjäystävällinen PSEUDOMARKER-tietokoneohjelma, joka on uskottavuus-pohjainen yhdistetty kytkentä- ja kytkentäepätasapainoanalyysi perheissä. Tämä PSEUDOMARKER-ohjelma mahdollistaa erilaisten aineistojen yhdistämisen yhteen ja samaan analyysiin, kuten tapauksia, verrokkeja, trioja, ydinperheitä ja suuria usean sukupolven perheitä. Lisäksi pseudomarker-menetelmää verrattiin muihin perhepohjaisiin assosiaatiomenetelmiin simulaatiotutkimuksella.

Kolmannessa osatyössä vertailtiin laajasti simulaatiotutkimuksella PSEUDOMARKER-ohjelman ja muiden yleisesti käytettyjen perhepohjaisten assosiaatio-ohjelmien tyypin I virhettä ja tilastotieteellistä voimaa. Tässä tutkimuksessa havaittiin, että jotkin menetelmät eivät sovellu assosiaatiotestaukseen kytkennän vallitessa ja uskottavuus-pohjaiset assosiaatiomenetelmät, jotka pystyvät ottamaan huomioon puuttuvaa genotyyppi- tai fenotyyppidataa ja pystyvät analysoimaan suuria perherakenteita, kuten PSEUDOMARKER-ohjelma, ovat voimakkaimpia erilaisten tautimallien vallitessa. Lisäksi tulostemme perusteella assosiaatioanalyysi perheaineistossa on voimakkaampaa kuin tapaus-verrokki aineistossa.

Neljännessä osatyössä tutkittiin uskottavuusosamäärätestin tilastotieteellisiä ominaisuuksia, kun testataan assosiaatiota kytkennän vallitessa, käyttäen epätarkkoja parametrista malleja. Tutkimuksessa havaitsimme, että suurimmassa osassa tilanteita epätarkat mallit toimivat moitteettomasti, mutta tietyissä tilanteissa, kun täysi kytkentä vallitsee tautilokuksen ja geenimerkin välillä, niin deterministisen vallitsevan analyysimallin käyttö ehdollisessa uskottavuusosamäärätestissä (olettaen kytkentä) saattaa johtaa väärää johtopäätökseen assosiaatiosta, kun todellinen malli on peittyvästi periytyvä.

Tässä väitöskirjatyössä olemme kehittäneet voimakkaan ja helppokäyttöisen ohjelman kytkentä- ja kytkentäepätasapainoanalyysin perheissä ja tapaus-verrokki aineistossa. Lisäksi olemme osoittaneet vastaavien menetelmien ylivoimaisuuden. Tutkimuksemme tulokset antavat tärkeää tietoa ihmisgenetiikan tutkijoille parhaista tavoista kerätä ja analysoida aineistoa.
URI: URN:ISBN:978-952-245-713-4
http://hdl.handle.net/10138/36771
Date: 2012-10-05
Copyright information: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
This item appears in the following Collection(s)

Show full item record

Search Helda


Advanced Search

Browse

My Account