Yliopiston etusivulle Suomeksi På svenska In English Helsingin yliopisto

Data Integration Methods to Interpret Genome-Scale Data from Cancers

Show full item record

Files in this item

Files Description Size Format View/Open
datainte.pdf 1.485Mb PDF View/Open
Use this URL to link or cite this item: http://urn.fi/URN:ISBN:978-952-10-8178-1
Vie RefWorksiin
Title: Data Integration Methods to Interpret Genome-Scale Data from Cancers
Author: Laakso, Marko
Contributor: University of Helsinki, Faculty of Medicine, Institute of Biomedicine, Institute of Biomedicine, Biochemistry and Developmental BiologyResearch Programs Unit, Genome-Scale Biology Research Program
Thesis level: Doctoral dissertation (article-based)
Abstract: The genetic alterations of cancer cells vary between individuals and during the progression of the disease. The advances in measurement techniques have enabled genome-scale profiling of mutations, transcription, and DNA methylation. These methods can be used to address the complexity of the disease but also raise an acute demand for the analysis of the high dimensional data sets produced.

An integrative and scalable computational infrastructure is advantageous in cancer research. First, a multitude of programs and analytic steps are needed when integrating various measurement types. An efficient execution and management of such projects saves time and reduces the probability of mistakes. Second, new information and methods can be utilised with a minor effort of re-executing the workflow. Third, a formal description of the program interfaces and the workflows aids collaboration, testing, and reuse of the work done. Fourth, the number of samples available is often small in comparison with the unknown variables, such as possibly affected genes, of interest. The interpretation of new measurements in the context of existing information may limit the number of false positives when sensitive methods are needed.

We have introduced new computational methods for the data integration and for the management of large and heterogeneous data sets. The suitability of the methods has been demonstrated with four cancer studies covering a wide spectrum of data from population genetics to the details of the transcriptional regulation of proteins, such as androgen receptor and forkhead box protein A1. The repeatable workflows established for these colorectal cancer, glioblastoma, and prostate cancer studies have been used to maintain up-to-date registries of results for follow-up studies.Syöpäsolujen geneettiset muutokset vaihtelevat potilaittain ja taudin edetessä. Mittausmenetelmien kehittyminen on mahdollistanut mutaatioiden, transkription, sekä DNA-metylaation genominlaajuisen kartoittamisen. Genomin kattavia menetelmiä voidaan käyttää monitekijäisten syöpäsairauksien tutkimuksessa, mutta niiden myötä on syntynyt tarve moniulotteisen tiedon tarkasteluun soveltuville menetelmille.

Joitakin syöpätutkimukseen liittyviä haasteita voidaan ratkaista yhdistävällä ja skaalautuvalla laskennallisella infrastruktuurilla. Ensimmäiseksi, erilaisten mittausten yhdistämiseen tarvitaan useita sovelluksia ja tarkasteluvaiheita. Kokonaisuuden automatisoitu suoritus ja hallinta säästävät aikaa ja pienentävät virheiden mahdollisuutta. Toiseksi, uutta tietoa ja menetelmiä päästään hyödyntämään pienellä vaivalla uudelleen suorittamalla työnkulku. Kolmanneksi, ohjelmistorajapintojen ja työnkulkujen määrämuotoinen kuvaus helpottavat yhteistyötä, testausta ja tehdyn työn uudelleenkäyttöä. Neljänneksi, saatavilla olevien näytteiden lukumäärä on usein pieni verrattuna kiinnostuksen kohteena oleviin tuntemattomiin muuttujiin, kuten mahdollisesti vioittuneisiin geeneihin. Uusien mittausten tulkinta olemassa olevan tiedon yhteydessä saattaa vähentää väärien positiivisten määrää kun tarvitaan herkkiä menetelmiä.

Olemme esitelleet uusia laskennallisia menetelmiä tiedon yhdistelyyn, sekä laajojen ja vaihtelevan muotoisten aineistojen käsittelyyn. Menetelmien käyttökelpoisuutta olemme havainnollistaneet soveltamalla niitä neljässä syöpätutkimuksessa, jotka liittyvät paksunsuolen syöpään, glioblastoomaan ja eturauhassyöpään. Tutkimusten aihealueet kattavat kirjon populaatiogenetiikasta transkriptiotekijöiden, kuten androgeenireseptorin ja FoxA1:n toiminnan, yksityiskohtiin. Tutkimusten puitteissa toistettavaan muotoon rakennetut työnkulut ovat tuloksineen tarjonneet ajantasaisen tietolähteen pohjaksi jatkotutkimuksille.
URI: URN:ISBN:978-952-10-8178-1
http://hdl.handle.net/10138/36299
Date: 2012-09-28
Copyright information: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.
This item appears in the following Collection(s)

Show full item record

Search Helda


Advanced Search

Browse

My Account