Robustin lineaarisen sekamallin soveltaminen DNA-metylaatiointensiteetin mallintamiseen

Näytä kaikki kuvailutiedot



Pysyväisosoite

http://urn.fi/URN:NBN:fi:hulib-201901171064
Julkaisun nimi: Robustin lineaarisen sekamallin soveltaminen DNA-metylaatiointensiteetin mallintamiseen
Tekijä: Karell, Pauliina
Muu tekijä: Helsingin yliopisto, Valtiotieteellinen tiedekunta, Sosiaalitieteiden laitos
University of Helsinki, Faculty of Social Sciences, Department of Social Research
Helsingfors universitet, Statsvetenskapliga fakulteten, Institutionen för socialvetenskaper
Julkaisija: Helsingin yliopisto
Päiväys: 2018
Kieli: fin
URI: http://urn.fi/URN:NBN:fi:hulib-201901171064
http://hdl.handle.net/10138/296491
Opinnäytteen taso: pro gradu -tutkielmat
Oppiaine: Tilastotiede
Statistics
Statistik
Tiivistelmä: Epigenetiikka on perinnöllisyystieteen ala, jossa tutkitaan ulkoisesti mitattavia ominaisuuksia ilmiasuja, joiden muutokset ilmenevät DNA-juosteen kemiallisina muutoksina. Nämä muutokset eivät ole periytyviä, kuten ihmisen DNA, vaan muokkautuvat ympäristön vaikutuksesta. Metylaatio on eräs epigeneettisistä muutoksista, jotka vaikuttavat geenisäätelyyn. Epigenetiikan avulla on pyritty selittämään eroja muun muassa samanmunaisten kaksosten välillä, ja tutkijoiden mielenkiinto on kohdistunut erityisesti metylaatioon sen helpon mitattavuuden ansiosta. Ihmisiltä erilaisia metyaatioalueita perimästä on kartoitettu noin 400 000, joista osan on tiedetty liittyvän esimerkiksi syövän ilmenemiseen. Tämä tutkielma keskittyy epigeneettisen aineiston tilastolliseen mallinnukseen kaksosaineistossa. Tutkittavaksi ilmiasuksi on valittu ikä, sillä iän on todettu olevan yhteydessä erilaisiin metylaatiomutooksiin. Monissa epigeneettisissä tutkimuksissa käytetään usein kaksosaineistoja, sillä samanmunaiset kaksoset jakavat täysin identtisen perimän keskenään ja usein myös yhteisen kasvuympäristön. Kaksosaineistoa käyttämällä saadaan usein kontrolloitua ympäristöstä johtuvaa vaihtelua, mutta tilastollinen mallinnus vaatii havaintojen riippuvuuden huomioisen. Metylaatioaineistossa saattaa esiintyä myös paljon keskiarvosta poikkeavia havaintoja, jolloin kyseessä on paksuhäntäisestä jakaumasta. Paksuhäntäisissä jakaumissa poikkeavien havaintojen vaikutusta pyritään pienentämään käyttämällä robusteja tilastollisia menetelmiä, jolloin tulokset ovat paremmin yleistettävissä yleiseen väestöön. Tässä tutkielmassa on huomioitu tilastollisessa mallinnuksessa sekä havaintojen riippuvuus että paksuhäntäisyys käyttämällä lineaarista t-sekamallia, sillä t-jakauma on robustimpi vaihtoehto aineiston jakaumaoletukseksi kuin perinteinen normaalijakauma. Lineaarisen t-sekamallin parametrien estimoiminen on toteutettu bayesiläisellä päättelyllä, jossa estimoituja parametreja voidaan tarkastella todennäköisyysjakaumina. Bayesiläisen tilastotieteessä aineistosta tehdään päätelmiä käyttämällä erilaisia todennäköisyysmalleja, mikä mahdollistaa monipuolisen ja joustavan mallimäärittelyn. Käyttämällä erilaista prioritietoa parametrijakaumista, mallin tuloksia voidaan arvioida joustavasti ja monipuolisesti. Tässä tutkielmassa lineaarisen t-sekamallin parametreille on määrätty erilaisia jakaumaoletuksia, jotta perhettä ja kaksosuutta on kyetty mallintamaan riittävästi. Varsinainen estimoitu on toteutettu rakentamalla stokastinen Markovin ketju, jota kutsutaan myös Gibbsin otannaksi. Tässä tutkielmassa selvitettiin iän vaikutusta kolmee erilaiseen metylaatikohtaan ja havaittiin, että kaikissa kolmessa metylaatiokohdassa iän kasvaessa myös metyloituneisuus kasvoi. Eräs kolmesta metylaaatioalueesta on erityisen mielenkiintoinen, sillä vastaavissa tutkimuksissa on saatu samankaltaisia tuloksia ja kyseinen metylaatioalue sijaitsee PDE4C-geeniä ilmentävässä alueessa. Kyseinen geeni vaikuttaa monien muiden solujen aktiivisuuten tuottamalla proteiinia, joka välittää signaaleja solun ulkopuolelle.
Avainsanat: robusti
lineaarinen
sekamalli
bayesiläinen
epigenetiikka
metylaatio
Asiasanat (yso): sekamalli
robusti
metylaatio
epigenetiikka
bayesiläinen


Tiedostot

Tiedosto(t) Koko Formaatti Näytä

Tähän julkaisuun ei ole liitetty tiedostoja

Viite kuuluu kokoelmiin:

Näytä kaikki kuvailutiedot