Genetic population structure in Finland: an advantage of haplotype information over independent genetic markers

Show full item record

Permalink

http://urn.fi/URN:NBN:fi-fe2015071010605
Title: Genetic population structure in Finland: an advantage of haplotype information over independent genetic markers
Author: Kerminen, Sini
Contributor: University of Helsinki, Faculty of Biological and Environmental Sciences, Department of Biosciences
Thesis level: Master's thesis
Abstract: Studies of population structure are motivated by the need to understand population history and to have well-characterised groups of individuals in studies of genetics of diseases and traits. A standard method to analyse genetic population structure is principal component analysis (PCA). A disadvantage of PCA is that it can reliably handle only independent genetic markers. This means that the genetic markers that are correlated with other genetic markers have to be excluded from the data. This leads to a loss of information. In 2012, Lawson et al. published a chromosome painting method that can utilise haplotype information, i.e. information from correlated markers, and thus it can detect more subtle differences in populations than the standard PCA. This thesis studies two questions. The first question is whether the chromosome painting method can provide more precise genetic clustering of geographically defined Finnish groups than the standard PCA method. The second question is whether the chromosome painting method can reveal new details of population structure in Finland. The data used in this study are from the FINRISK Study survey of 1997. This cohort includes the genotype data of about 4,000 individuals and the information about individuals and their parents birthplaces. 345 Individuals were randomly chosen from the cohort in such a way that both of their parents were originated from the same province. Ten provinces of Finland were used as study groups for the method comparison. First, the data were analysed with SmartPCA (a standard PCA method) and ChromoPainter (the chromosome painting method) and the results were compared both visually and quantitatively. Finally, the individuals were assigned to populations based on the ChromoPainter result using FineSTRUCTURE program and these genetic populations were compared to the geographic origin of the individuals. The results showed that the chromosome painting method clustered seven out of ten groups significantly tighter than the standard PCA. Nevertheless, SmartPCA was faster and easier to use than ChromoPainter. The main population genetic division was found between the eastern and western parts of Finland, which was consistent with earlier studies. All in all, 15 populations were detected and the results revealed that they were geographically clustered. The genetic populations correlated well with the borders of Finnish provinces and counties. As the first conclusion, the chromosome painting method was able to give more precise results than the standard PCA but the standard PCA is still more suitable for quick preliminary analyses of genetic data. As the second conclusion, the chromosome painting method was able to detect detailed subpopulation structure in Finland and these populations are geographically clustered. Results provide an excellent basis for the future studies of population structure and genetic diseases in Finland.Populaatiorakenteen tutkimusta motivoi parhaiten ihmisen halu tuntea alkuperänsä. Lisäksi populaatiorakenteen ymmärtäminen on tärkeää geneettisten sairauksien tutkimuksessa. Esimerkiksi tapaus-verrokkitutkimuksissa tutkittavien ryhmien tulisi vastata toisiaan eri muuttujien, myös geneettisen rakenteen, suhteen. Jos ryhmien välillä on otannasta johtuvaa geneettistä eroa, voivat tulokset johtaa väärään johtopäätökseen, jossa tutkittava asia assosioituu perimään virheellisesti. Yksi käytetyimmistä menetelmistä yksilöiden välisten geneettisten erojen havaitsemiseen on pääkomponenttianalyysi (PCA). PCA:n ongelma on kuitenkin se, että se voi analysoida luotettavasti ainoastaan riippumattomia geenimerkkejä. Tämä tarkoittaa, että geneettisestä aineistosta on poistettava kytkeytyneet geenimerkit ja tietoa yksilöiden välisistä pienistä eroista katoaa. Vuonna 2012 Lawson ym. kehittivät menetelmän, joka pystyy huomioimaan myös kytkeytyneet geenimerkit. Tämä kromosomin jaottelumenetelmä tutkii yksilöiden genomia haplotyypeittäin. Näin ollen kromosomin jaottelumenetelmä mahdollistaa yksityiskohtaisemman populaatioiden tutkimisen kuin perinteinen pääkomponenttianalyysi. Tämä tutkielma keskittyy kahteen pääkysymykseen. Ensimmäinen kysymys on, pystyykö kromosomin jaottelumenetelmä erottamaan ja ryhmittämään maantieteellisesti samoilta alueilta peräisin olevat yksilöt paremmin kuin perinteinen PCA-menetelmä. Toinen kysymys on, pystyykö kromosomin jaottelumenetelmä löytämään uusia hienorakenteita Suomen populaatiorakenteesta. Tutkimuksen käytettiin aineistona suomalaista FINRISKI 1997 -tutkimusta, joka koostuu n. 4 000 yksilön genotyyppiaineistosta sekä yksilöiden ja heidän vanhempiensa syntymäpaikkatiedoista. Aineistosta valittiin satunnaisesti 345 yksilöä, joiden molemmat vanhemmat ovat kotoisin samasta läänistä. Tutkimuksessa oli mukana yksilöitä kymmenestä läänistä ja läänejä käsiteltiin vertailussa omina ryhminään. Ensimmäiseksi aineisto analysoitiin käyttäen SmartPCA (perinteinen PCA-menetelmä) sekä ChromoPainter (kromosomin jaottelumenetelmä) -ohjelmia ja tuloksia vertailtiin sekä visuaalisesti että kvantitatiivisesti. Tämän jälkeen yksilöt jaettiin populaatioihin kromosomin jaottelumenetelmän tulosten perusteella käyttäen FineSTRUCTURE-ohjelmaa. Lopuksi populaatiojakoa verrattiin yksilöiden maantieteelliseen alkuperään. Työn tulokset osoittivat, että kromosomin jaottelumenetelmä ryhmitteli selkeästi tiiviimmin seitsemän kymmenestä testiryhmästä kuin perinteinen PCA. Kuitenkin SmartPCA oli nopeampi ja helppokäyttöisempi kuin ChromoPainter. Geneettisissä populaatiotuloksissa erottui ensimmäisenä jako Itä- ja Länsi-Suomen välillä, mikä vastaa hyvin aiempien tutkimusten tuloksia. Kaiken kaikkiaan Suomesta löytyi yhteensä 15 populaatiota, joiden maantieteelliset alueet noudattelivat pääosin Suomen entisten läänien ja maakuntien rajoja. Ensimmäisenä johtopäätöksenä todettiin, että kromosomin jaottelumenetelmä antaa tarkempia tuloksia kuin perinteinen PCA. Perinteinen PCA kuitenkin soveltuu edelleen alustaviin analyyseihin nopeutensa vuoksi. Toisena johtopäätöksenä todettiin, että kromosomin jaottelumenetelmä löysi ennennäkemättömiä hienorakenteita Suomesta ja nämä rakenteet ovat maantieteellisesti ryhmittyneitä. Tulokset luovat erinomaisen pohjan populaatiorakenteen ja geneettisten sairauksien jatkotutkimukselle Suomessa.
URI: URN:NBN:fi-fe2015071010605
http://hdl.handle.net/10138/155656
Date: 2015-06-10
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
geneticp.pdf 5.120Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record