Accounting for population admixture in genomic evaluations

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-952-10-8890-2
Title: Accounting for population admixture in genomic evaluations
Author: Makgahlela, Mahlako
Contributor: University of Helsinki, Faculty of Agriculture and Forestry, Department of Agricultural Sciences
Publisher: Helsingin yliopisto
Date: 2014-02-07
Belongs to series: Department of Agricultural Sciences Publications - URN:ISSN:1798-744X
URI: http://urn.fi/URN:ISBN:978-952-10-8890-2
http://hdl.handle.net/10138/42536
Thesis level: Doctoral dissertation (article-based)
Abstract: Genomic evaluations of animals in multi-breed and admixed populations tend to ignore the population structure and assume that these populations are homogeneous, which may lead to limited success in the application of this technology. The objective of this thesis was to develop approaches for accounting for the admixed structure of the Nordic Red dairy cattle (RDC) and furthermore, investigate the predictive ability of these methods in the estimation of genomic enhanced breeding values. The Nordic RDC population is a composite of the Finnish Ayrshire, Swedish Red, Norwegian Red, Danish Red, and their crosses with other breeds. The study was carried out using individual breed proportions derived from the pedigree to define the base breeds, dense marker genotypes and phenotypes of progeny tested bulls with reliabilities from traditional evaluations close to one. Two approaches were developed: (1) the multi-trait random regression model, which accounts for the interactions between marker effects and base breed origin of alleles, (2) the adjusted genomic relationship matrices by allele frequencies (AF) estimated within breeds versus across breeds, estimated from the currently genotyped versus the base (founding) population. Then, the predictive ability of genomic relationships accounted for breed composition was investigated in genomic evaluations with GBLUP of genotyped animals only, and GBLUP of both genotyped and ungenotyped animals (single-step GBLUP). Information in all evaluation models were weighted by the reliability of the phenotype (i.e., bull or cow deregressed breeding value). The validation of genomic evaluations for all models was assessed as the regression of phenotype on direct estimated genomic values or genomic enhanced breeding values. Gains in validation reliabilities were 2 and 3% for milk and protein, respectively, and -1% using the multi-trait random regression model in comparison to GBLUP model that assumed a homogeneous population. The use of AF within breeds greatly reduced differences in additive genomic relationship coefficients between populations, when assessed both across and within sub-populations. This was more evident and closer to pedigree relationships when breed-wise AF were estimated from the base population. Whereas the use of AF across breeds increased genomic relationships, especially for individuals that were originating from populations that were further from the mean population AF across breeds. Accounting for the population structure with breed-wise AF also, relaxed assumptions when incorporating pedigree-based relationships for single-step GBLUP. This advantage however, was not achieved in genomic evaluations. The validation reliabilities between GBLUP with breed-wise AF and GBLUP with AF across breed were generally similar at 33% for milk and protein and 43% for fat. The validation reliabilities increased to 37%, 40% and 47% for milk, protein and fat, respectively, but were similar irrespective of AF used to compute genomic relationships in single-step GBLUP. The improvement in at least 5% for all traits with single-step GBLUP shows the benefit of utilizing all the available information into genomic evaluations. From the methods developed, it was concluded that accounting for the population structure overall had marginal advantage in the predictive ability of genomic evaluations. However, as genomic selection is becoming a dominant tool, biased evaluations in multi-breeds from ignoring differences between breeds is clearly to be feared. Therefore, a more reasonable and cautious approach for integrating genomic information in multi-breeds would be from single-step evaluations that utilize cow performance record as phenotype and genomic relationships accounted for varying AF between the breeds founder populations.Genomisen tiedon käyttö eläinten valinnassa (genominen valinta) on tehostanut lypsylehmien jalostusta. Tärkeimmät syyt jalostuksen tehostumiseen ovat arvosteluvarmuuden paraneminen varsinkin nuorilla eläimillä sekä lyhentynyt sukupolvien välinen aika. Genomisen valinnan avulla voidaan saavuttaa jopa 70% arvosteluvarmuus tuotosominaisuuksien suhteen Holstein-rotuisilla eläimillä ilman eläimen omaa tai jälkeläisten tuotoksia. Myös pohjoismaisella punaisella rodulla genomisen valinnan arvosteluvarmuus on kohtuullisen hyvä, mutta sitä on rajoittanut rodulle ominainen useasta eri alkuperästä johtuva populaatiorakenne. Pohjoismainen punainen rotu koostuu alkuperäisistä suomalaisista Ayshirestä, ruotsalaisesta, tanskalaisesta ja norjalaisesta punaisesta rodusta sekä niiden eriasteista risteytyksistä myös muiden kuin pohjoismaisten rotujen kanssa. Tutkimuksen tavoitteena oli kehittää menetelmiä, joilla pohjoismaisen punaisen rodun populaatiorakenne voitaisiin ottaa huomioon genomisessa valinnassa sekä tutkia näiden menetelmien arvosteluvarmuutta. Käytetty aineisto sisälsi sukupuutiedot, joiden avulla kullekin eläimelle voitiin laskea sen rotusuhteet (kuinka monta prosenttia eläimen perimästä on peräisin esim. Ayshirestä ja ruotsalaisesta punaisesta jne.) ja määrittää sen pääasiallinen rotualkuperä. Aineisto sisälsi myös keinosiemennyssonnien jalostusarvot ja genotyypit (SNP, pistemutaatiomerkki). Tutkimuksessa kehitettiin kaksi rotualkuperän huomioivaa menetelmää genomiseen valintaan. Ensimmäinen menetelmä oli ns. monen ominaisuuden satunnaisregressiomalli (menetelmä 1), jossa kullekin eläimelle laskettiin genominen jalostusarvo huomioimalla eläimen rotualkuperä. Toisessa testattavassa menetelmässä (menetelmä 2) eläinten väliset sukulaisuudet laskettiin SNP genotyyppien perusteella (genominen sukulaisuusmatriisi) kuitenkin niin, että sukulaisuuksien laskennassa käytettiin rotukohtaisia alleelifrekvenssejä sen sijaan, että olisi käytetty rotujen yli laskettuja alleelifrekvenssejä. Menetelmällä 2 laskettiin genomiset jalostusarvot joko ainoastaan genotyypitetyille sonneille tai samanaikaisesti populaation kaikille eläimille. Menetelmien antamaa arvosteluvarmuutta verrattiin vastaaviin menetelmiin, joissa populaation rakennetta ei huomioitu. Menetelmän 1 antama arvosteluvarmuus oli keskimäärin 2% parempi maitotuotoksen, 3% parempi valkuaistuotoksen ja 1% huonompi rasvatuotoksen suhteen kuin menetelmällä, jossa populaation rakennetta ei huomioitu. Rotukohtaisten alleelifrekvenssien huomioiminen genomisen sukulaisuusmatriisin muodostamisessa (menetelmä 2) ei parantanut arvosteluvarmuutta verrattaessa menetelmään, jossa niitä ei huomioitu. Sen sijaan genomisten jalostusarvojen laskeminen populaation kaikille eläimillä samanaikaisesti antoi keskimäärin 5% paremman arvosteluvarmuuden kuin tilanne, jossa genomiset jalostusarvot laskettiin vain genotyypitetyille sonneille. Yhteenvetona voidaan todeta, että populaatiorakenteen huomioiminen genomisten jalostusarvojen laskennassa tuo vain pienen parannuksen arvosteluvarmuuteen. Sen sijaan genomisten jalostusarvojen laskeminen populaation kaikille eläimille samanaikaisesti on suositeltavaa.
Subject: animal Science
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
makgahlela_dissertation.pdf 1.430Mb PDF View/Open

This item appears in the following Collection(s)

Show full item record