Computational Methods for Detecting Large-Scale Chromosome Rearrangements in SNP Data

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-952-10-6466-1
Title: Computational Methods for Detecting Large-Scale Chromosome Rearrangements in SNP Data
Author: Kollin, Jussi
Contributor: University of Helsinki, Faculty of Science, Department of Computer Science
Helsinki Institute for Information Technology
Publisher: Helsingin yliopisto
Date: 2010-10-25
Language: en
URI: http://urn.fi/URN:ISBN:978-952-10-6466-1
http://hdl.handle.net/10138/21329
Thesis level: Doctoral dissertation (monograph)
Abstract: Large-scale chromosome rearrangements such as copy number variants (CNVs) and inversions encompass a considerable proportion of the genetic variation between human individuals. In a number of cases, they have been closely linked with various inheritable diseases. Single-nucleotide polymorphisms (SNPs) are another large part of the genetic variance between individuals. They are also typically abundant and their measuring is straightforward and cheap. This thesis presents computational means of using SNPs to detect the presence of inversions and deletions, a particular variety of CNVs. Technically, the inversion-detection algorithm detects the suppressed recombination rate between inverted and non-inverted haplotype populations whereas the deletion-detection algorithm uses the EM-algorithm to estimate the haplotype frequencies of a window with and without a deletion haplotype. As a contribution to population biology, a coalescent simulator for simulating inversion polymorphisms has been developed. Coalescent simulation is a backward-in-time method of modelling population ancestry. Technically, the simulator also models multiple crossovers by using the Counting model as the chiasma interference model. Finally, this thesis includes an experimental section. The aforementioned methods were tested on synthetic data to evaluate their power and specificity. They were also applied to the HapMap Phase II and Phase III data sets, yielding a number of candidates for previously unknown inversions, deletions and also correctly detecting known such rearrangements.Ihmisten perimissä on yksilöllistä vaihtelua. Tämä vaihtelu voi olla useaa eri tyyppiä. Esimerkiksi yksittäisiä emäspareja koskettavat pistemutaatiot ovat usein helposti ja halvasti mitattavissa. Perimä voi kuitenkin vaihdella myös suuremmalla mittakaavalla. Osa perimästä voi olla joissakin tapauksissa kääntynyt toisin päin tai saattaa puuttua kokonaan; edellistä vaihtelutyyppiä kutsutaan inversioksi ja jälkimmäistä deletioksi. Inversioiden ja deletioiden tunnistaminen perimästä ei ole yhtä helppoa kuin pistemutaatioista seuranneiden SNP:ien (single nucleotide polymorphism) mittaaminen. Tässä väitöstyössä on kehitetty menetelmiä, jotka pyrkivät tunnistamaan inversioiden ja deletioiden jälkiä SNP-aineistoista. Menetelmien tavoitteena on ohjeistaa, mitä alueita perimästä on syytä tarkastella muilla tarkemmilla, mutta kalliimmilla, keinoilla tällaisten suurten perimämuutosten tunnistamiseksi. Väitöstyössä esitetään myös tietokoneohjelma, joka tuottaa inversion sisältäviä synteettisiä SNP-aineistoja. Tämän ohjelman avulla tarkastellaan eri inversiontunnistusmenetelmien toimivuutta erilaisissa koetilanteissa. Kokeiden mukaan tietynlaiset inversiot tunnistuvat kehitetyllä menetelmällä hyvin. Kehitettyjä menetelmiä sovellettiin useasta eri ihmispopulaatiosta kerätyn Hapmap-aineiston analysointiin. Tuloksena menetelmät antoivat jo aiemmin tunnettuja inversioita ja deletioita sekä uusia ehdokasalueita kokeellista validointia varten.
Subject: tietojenkäsittelytiede
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
computat.pdf 1.601Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record