LD Score regression for estimating and partitioning heritability of lipid levels in the Finnish population

Show full item record



Permalink

http://urn.fi/URN:NBN:fi-fe201804208668
Title: LD Score regression for estimating and partitioning heritability of lipid levels in the Finnish population
Author: Hautakangas, Heidi
Contributor: University of Helsinki, Faculty of Science, Department of Mathematics and Statistics
Publisher: Helsingin yliopisto
Date: 2018
Language: eng
URI: http://urn.fi/URN:NBN:fi-fe201804208668
http://hdl.handle.net/10138/273501
Thesis level: master's thesis
Discipline: Statistics
Tilastotiede
Statistik
Abstract: Erilaisten geneettisten tekijöiden vaikutusten määrittäminen on tärkeää, jotta voidaan ymmärtää biologiaa monitekijäisten ominaisuuksien taustalla. Periytyvyys on populaatioparametri, jolla estimoidaan geneettisten tekijöiden osuutta ilmiasun vaihtelussa. Viime aikoina tilastollisen genetiikan tavoitteena on ollut periytyvyyden estimoiminen genominlaajuisten assosiaatiotutkimusten (GWAS) tuloksista. GWAS:t ovat osoittaneet, että monitekijäisten ominaisuuksien ilmenemiseen vaikuttaa suuri joukko geenimuotoja, joilla on yksittäin pieni vaikutus. Koska yksittäiset vaikutukset ovat pieniä, on GWAS:n haasteena saavuttaa riittävä tilastollinen voima niiden havaitsemiseen. Tilastollista voimaa voidaan kasvattaa otoskokoa kasvattamalla, tyypillisesti meta-analyysiä hyödyntäen. Meta-analyysissä yhdistetään usean yksittäisen tutkimuskohortin tulokset, minkä seurauksena pääsy meta-analyysin pohjana oleviin yksilötason aineistoihin on useimmiten mahdotonta. Tutkielmassa perehdytään kytkentäepätasapainopistemääräregressio (LDSC) -menetelmään, joka arvioi periytyvyyttä regressoimalla GWAS-tulokset kytkentäepätasapaino (LD) -pistemääriä vasten. LD-pistemäärät mittaavat kuinka paljon geneettistä vaihtelua kukin geenimerkki ilmentää. Erityisesti LD-pistemäärät voidaan estimoida verrokkipaneelista, eikä yksilötason aineistoa tarvita. Lisäksi tutkielmassa perehdytään ositettuun LD-pistemääräregressioon (S-LDSC), jolla periytyvyys voidaan osittaa erilaisiin genomin toiminnallisiin luokkiin. Tutkielmalla on kolme tavoitetta. Ensimmäinen tavoite on kuvailla LDSC:ssa käytettävä tilastotiede. Toinen tavoite on arvioida eri LD-pistemäärien verrokkipaneelien vaikutusta lipiditasojen periytyvyyden estimointiin suomalaisessa populaatiossa vertailemalla GWAS-otoksen sisäistä paneelia ulkopuolisiin paneeleihin. Kolmas tavoite on osittaa eri lipiditasojen periytyvyys erilaisiin genomin toiminnallisiin luokkiin käyttäen S-LDSC-menetelmää. Tutkielmassa menetelmiä sovelletaan FINRISKI-tutkimukseen käyttäen neljää lipiditasomuuttujaa: HDL-, LDL- ja kokonaiskolesterolia sekä triglyseridejä. Tutkielmassa havaittiin, että LDSC oli vakaa LD-pistemäärän verrokkipaneelin valinnan suhteen, kun menetelmää sovellettiin suomalaiseen populaatioon. Periytyvyyden estimaatit olivat yhteneviä eri LD-pistemäärän verrokkipaneelien välillä huolimatta eroista LD-pistemäärissä. Suomalaiset paneelit tuottivat sekä suurimmat periytyvyyden piste-estimaatit että pienimmät sekoittavista tekijöistä johtuvaa harhaa kuvaavat piste-estimaatit, joskaan erot eivät olleet tilastollisesti merkitseviä. Analyysit periytyvyyden rikastumisesta toistivat useita aiemmin raportoituja tuloksia: rikastumista havaittiin esimerkiksi useissa histonimerkeissä kaikkien lidipitasojen kohdalla sekä super-vahvistajissa HDL-kolesteroli-, kokonaiskolesteroli- ja triglyseriditasojen kohdalla.To better understand biology of complex traits, quantifying the contribution of different genetic factors is essential. Heritability is a population parameter that estimates the proportion of phenotypic variance explained by genetic factors. A recent goal in statistical genetics has been to estimate heritability from genome-wide association study (GWAS) data. GWAS have shown that a large number of genetic variants with small effects together affect complex traits. Because the individual effects are so small, a challenge of the GWAS is to achieve enough statistical power to detect the true associations. Statistical power has been increased by increasing the GWAS sample size, typically by a meta-analysis. In a meta-analysis, summary association statistics from multiple study cohorts are jointly analysed, and therefore it is often impossible to get access to the original individual-level data underlying the meta-analysis. In this thesis, I will study linkage disequilibrium score regression (LDSC), that estimates heritability by regressing GWAS summary statistics on linkage disequilibrium (LD) scores, that measure how much genetic variation each variant tags. Importantly, LD Scores can be estimated from a reference panel without requiring any individual-level data. Furthermore, I will study stratified LD Score regression (S-LDSC), that is an extension of LDSC for partitioning heritability by functional annotations. This thesis has three aims. First, to explain the statistics behind LDSC. Second, to evaluate the effect of LD reference panel on heritability estimation of lipid levels in the Finnish population by comparing an in-sample LD reference panel to external LD reference panels. Third, to partition the heritability of lipid levels in the Finnish population by functional annotations using S-LDSC. I applied LDSC and S-LDSC to the National FINRISK Study and used four lipid levels as quantitative phenotypes: high-density lipoprotein cholesterol (HDL-C), low-density lipoprotein cholesterol (LDL-C), triglycerides (TG) and total cholesterol (TC). As results, I observed that LDSC was robust to the choice of LD reference panel when applied to the Finnish population. Heritability estimates were consistent between different LD reference panels regardless of the LD mismatch. The highest heritability point estimates and the lowest point estimates of confounding biases were produced by the Finnish specific panels, though the differences were not statistically significant. In the heritability enrichment analyses, I replicated several previous findings: for example, I observed enriched heritability for many histone marks in all four lipid traits and enriched heritability for super enhancers for HDL-C, TC and TG.


Files in this item

Total number of downloads: Loading...

Files Size Format View
MT_ldsc_hautakangas.pdf 3.412Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record