Association between polygenic methylation scores and maternal phenotypes

Show full item record



Permalink

http://urn.fi/URN:NBN:fi-fe201804208632
Title: Association between polygenic methylation scores and maternal phenotypes
Author: Tuominen, Samuli
Other contributor: Helsingin yliopisto, Matemaattis-luonnontieteellinen tiedekunta, Matematiikan ja tilastotieteen laitos
University of Helsinki, Faculty of Science, Department of Mathematics and Statistics
Helsingfors universitet, Matematisk-naturvetenskapliga fakulteten, Institutionen för matematik och statistik
Publisher: Helsingin yliopisto
Date: 2018
Language: eng
URI: http://urn.fi/URN:NBN:fi-fe201804208632
http://hdl.handle.net/10138/273626
Thesis level: master's thesis
Discipline: Statistics
Tilastotiede
Statistik
Abstract: Nykypäivän teknologia ja laskentateho ovat mahdollistaneet laajamittaisen ihmisen epigenomin tutkimuksen. Yksi kiinnostavimpia epigenettisiä muutoksia on DNA-metylaatio, sillä sitä on verrattain helppo tutkia ja sitä esiintyy laajalti DNA:ssa. Metylaatiokohta on alue DNA:ta, jonka kohdalla havaitaan vaihtelua metylaatiossa yksilöiden välillä. Epigenominlaajuiset kytkentätutkimukset tarkastelevat erikseen monien metylaatiokohtien yhteyksiä johonkin tiettyyn ihmisen piirteeseen tai ympäristöaltistukseen. Epigenominlaajuisia kyntkentätutkimuksia kuitenkin hankaloittaa alhainen tilastollinen voima sekä monitestausongelma. Yhtenä ratkaisuna näihin ongelmiin on kehitetty polygeeniset metylaatiopistemäärät, jotka kokoavat yhteen tietoa monista metylaatiokohdista. Näillä pistemäärillä on kaksi pääasiallista sovelluskohdetta. Ensinnäkin pistemäärien avulla voidaan kehittää uusia selitysmalleja ihmisen piirteille. Toiseksi pistemääriä voidaan käyttää havaitsemattomien ympäristöaltistusten indikoimiseen tai ennustamaan yksilön kehitystä tai tauteja tulevaisuudessa. Tämän tutkielman alussa on johdanto epigenetiikkaan, epigenominlaajuisiin kytkentätutkimuksiin ja metylaatiopistemääriin sekä niiden geneettisiin vastinpareihin, genominlaajuisiin kytkentätutkimuksiin sekä polygeneettisiin riskipistemääriin. Monet metylaatiopistemääriin sovelletuista menetelmistä on lainattu geneettiseltä puolelta. Tässä tutkielmassa on johdettu joitakin metylaatiopistemäärien tilastollisia ominaisuuksia, pääpainon ollessa siinä, miten tilastollinen voima havaita yhteys metylaatiopistemäärän ja ihmisen piirteiden välillä muuttuu, kun pistemäärän rakenne muuttuu. Teoreettiset tulokset todennetaan simulaatioiden avulla. Tässä tutkielmassa myös selvitetään, miten metylaatiopistemääriä voidaan muodostaa ristiin-validioinnin sekä korrelaatiota karsivan menetelmän avulla. Tätä menetelmäkehikkoa sovelletaan suomalaisesta Predo-tutkimuksesta tulevaan kohorttitason dataan. Teoreettisen ja havaitun tilastollisen voiman vertailu simulaatioiden avulla näyttää, että teoreettinen ja havaittu voima vastaavat hyvin toisiaan. Tutkielman käytännön analyysit perustuvat Predo-kohortin metylaatio- ja fenotyyppidataan sekä äidin painoindeksin yhteyttä lapsen metylaatioon tutkineeseen epigenominlaajuisen kyntkentätutkimukseen. Analyyseissä näkyy selvä yhteys äidin painoindeksin sekä lapsen metylaatiodatan pohjalta lasketun metylaatiopistemäärän välillä. Tulokset ovat linjassa aiempien tutkimustulosten kanssa, jotka viittavat siihen, että metylaatiopistemääriä voidaan käyttää raskausajan tekijöiden indikoimiseen lapsen DNA-metylaatiosta.Modern day technology and computational power have allowed a large scale investigation of the human epigenome. Out of the epigenetic modifications, DNA methylation is of particular interest, since it is relatively easy to measure and very common in the DNA. A methylation site is a region of the DNA sequence that shows variation in the DNA methylation between individuals. Epigenome-wide association studies (EWAS) examine the interaction between these methylation sites one at a time and a specific human trait or an enviromental exposure. EWAS studies are, however, limited by low statistical power and problems related to multiple testing. To counter these issues, polygenic methylation scores have been developed to aggregate information over many methylation sites. These scores have two main applications. First is to formulate new hypotheses to explain human trait variation. Second one is to indicate unobserved environmental factors in cohort based studies or to predict individual developmental or disorder related outcomes. At the beginning of this thesis there is an introduction to epigenetics, to EWAS and polygenic methylation scores and to their genetic counterparts, genome-wide association studies (GWAS) and polygenic risk scores (PRS). Much of the methodology relating to the methylation scores is borrowed from GWAS and PRS. Some statistical properties of the methylation scores are derived in this thesis with focus on how the statistical power of detecting true association between a phenotype and human DNA methylation depends on the make up of the methylation scores. The theoretical derivations are tested through simulations. This thesis also examines how methylation scores may be calculated in practice using cross-validation and correlation reduction procedure called clumping. The methodology is applied to a Finnish cohort from the prediction and prevention of preeclampsia and intrauterine growth restriction study (Predo). The comparison of theoretical and observed statistical power in the simulations show that the theoretical and observed power correspond well to each other. In the practical analyses conducted using the DNA methylation data set and phenotype data of the Predo cohort and a maternal body-mass index (BMI) EWAS data, a clear piece of evidence of association of maternal pre-pregnancy BMI and offspring DNA methylation is found. The results support the growing evidence for the applicability of methylation scores in indicating prenatal environmental factors from the DNA methylation of the offspring.


Files in this item

Files Size Format View

There are no files associated with this item.

This item appears in the following Collection(s)

Show full item record