Single-step genomic prediction in small-scale populations

Show full item record



Permalink

http://urn.fi/URN:ISBN:978-951-51-7297-6
Title: Single-step genomic prediction in small-scale populations
Author: Kudinov, Andrei
Contributor: University of Helsinki, Faculty of Agriculture and Forestry
Doctoral Programme in Sustainable Use of Renewable Natural Resources
Natural Resources Institute Finland (LUKE)
Publisher: Helsingin yliopisto
Date: 2021-06-17
Language: en
Belongs to series: URN:ISSN:2342-5431
URI: http://urn.fi/URN:ISBN:978-951-51-7297-6
http://hdl.handle.net/10138/330203
Thesis level: Doctoral dissertation (article-based)
Abstract: Implementation of genomic evaluation is challenging for populations with limited data. The main objective of this thesis was to identify an approach to implement single-step genomic best linear unbiased prediction (ssGBLUP) in a small-scale dairy cattle population. In particular, the aims were to predict GEBVs by ssGBLUP using local genotypes, enhance the reliability of prediction by incorporating data from an external breeding population, and implement the metafounder approach. The first objective of this study was to develop state-of-the-art BLUP Animal Model for Holstein (HOL) and Russian Black & White cattle of Leningrad region (LR, Russia). The traits of focus were milk, fat, and protein yield. The data used to develop the first (FLM) and multiple (MLM) lactation models included 320,633 repeated 305d records from 49 herds. The heritability estimates for milk, fat, and protein yield were 0.24, 0.20, and 0.20 for FLM and 0.18, 0.19, and 0.18 for MLM. For cows born between 2000 and 2016, MLM estimated an annual average genetic gain of 56 kg, 1.84 kg, and 1.62 kg for milk, fat, and protein yield, respectively. The second objective was to implement ssGBLUP for LR using a set of local genotyped animals. Genomic data were available from 1080 cows and 427 bulls. MLM was improved by adding a herd by sire interaction random effect. Milk yield cross-validation analysis showed a validation reliability (R^2) of 0.21 and 0.38 for bulls and cows, respectively. The R^2 values for fat yield for bulls and cows were 0.17 and 0.41. The third objective was to enhance the LR ssGBLUP prediction by using external DFS (Denmark, Finland, and Sweden) HOL genomic and pedigree information. The inclusion of DFS genotypes did not change the milk yield R^2 for bulls but slightly decreased it for cows (0.38 to 0.36). For fat yield, R^2 increased from 0.17 to 0.18 for bulls and decreased from 0.41 to 0.34 for cows. In analysis of milk yield, the highest R^2 was realized in the ssGBLUP model simultaneously using genomic and phenotypic data from both LR and DFS: 0.30 for bulls and 0.42 for cows. In fat yield, no improvement in R^2 was observed (0.18) for bulls and an unexpected decrease was observed for cows (0.21). The fourth objective was to implement the metafounder (MF) approach in ssGBLUP. The data were a subset of Finnish Red dairy cattle, including 112,479 cows with first lactation 305d milk records. Genomic data were obtained from 3,571 bulls and 16,186 cows. MF covariance matrix (Γ) was created using base population allele frequencies estimated using a one-generation pedigree for each animal. After the estimation, markers were filtered with a minor allele frequency criterion of 0.05. Diagonal elements of the genomic relationship matrix had a lower correlation with the regular pedigree relationship matrix (A; 0.66) than with the one using Γ (A^Γ; 0.76). Validation reliability of milk GEBVs in bulls increased by 0.04 (from 0.27 to 0.31) when using the MF approach. In cows the gain was 0.01 (from 0.36 to 0.37).Genomiarvostelun rakentaminen pienille populaatioille on haastavaa. Väitöskirjan päätavoitteena oli löytää genominen eläinmalli -jalostusarvostelu (ssGBLUP, single-step genomic best linear unbiased prediction), joka soveltuisi pienille lypsykarjapopulaatioille. Tavoitteena oli arvioida GEBV:t ssGBLUP-mallilla hyödyntämällä sekä pienen että toisen suuremman populaation genotyyppi-informaatiota käyttäen ns. metafounder-menetelmää. Tämän odotettiin parantavan genomisten jalostusarvojen arvosteluvarmuuksia. Väitöskirjan ensimmäisenä tavoitteena olikin luoda sekä holsteinille että venäläiselle mustavalkoiselle rodulle maito-, rasva- ja valkuaistuotosten eläinmalli BLUP -jalostusarvostelumallit Leningradin alueen (LR) Venäjällä. Aineisto, jota käytettiin ensimmäisen (FLM) ja myöhempien lypsykausien (MLM) jalostusarvostelumallien luomiseen koostui 49 karjan 320,633:sta 305 päivän tuotostiedosta. Maito-, rasva- ja valkuaistuotoksen periytymisasteet olivat 0.24, 0.20 ja 0.20 FLM-aineistossa sekä 0.18, 0.19 ja 0.18 MLM-aineistossa. Vuosina 2000-2016 syntyneiden MLM-lehmien keskimääräinen vuosittainen perinnöllinen edistyminen oli 56 kg maitoa, 1.84 kg rasvaa ja 1.62 kg valkuaista. Toisena tavoitteena oli ottaa LR-alueen eläimille käyttöön ssGBLUP-menetelmään perustuva genomiarvostelu käyttäen paikallisia genotyypitettyjä eläimiä. Genotyypitettyjä lehmiä oli 1080 ja sonneja 427. MLM-mallia parannettiin lisäämällä malliin satunnainen karja-sonni yhdysvaikutus. Maitotuotoksen jalostusarvostelujen arvosteluvarmuus (R2) oli 0.21 sonneille ja 0.38 lehmille. R2-arvot rasvatuotokselle olivat 0.17 (sonnit) ja 0.41 (lehmät). Kolmantena tavoitteena oli parantaa LR-alueen eläinten ssGBLUP-arvosteluja hyödyntämällä Tanskan, Suomen ja Ruotsin (DFS) holstein-populaation genomi- ja sukulaisuustietoja. DFS-genotyyppien mukaanotto ei vaikuttanut sonnien maitotuotoksen R2-arvoihin, mutta lehmien R2 heikkeni hieman 0.38:sta 0.36:een. Sonnien rasvatuotoksen R2 parani 0.17:sta 0.18:sta ja lehmien heikkeni 0.41:sta 0.34:een. Korkein maitotuotoksen jalostusarvostelujen arvosteluvarmuus saatiin, kun ssGBLUP-mallissa oli samaan aikaan sekä LR- että DFS-eläinten feno- että genotyypit (sonnit 0.30, lehmät 0.42). Rasvatuotoksen osalta vastaavaa parannusta ei tapahtunut sonneille (R2 0.18) ja lehmien R2 jopa yllättäen laski (R2 0.20). Neljäntenä tavoitteena oli sovittaa ssGBLUP-malleihin metafounder-menetelmä (MF), joka korvaa perinteiset geneettiset ryhmät. Aineistona käytettiin otosta suomalaisesta ayrshire-populaatiosta. Mukana oli 112,479 ensikon 305-päivän tuotostiedot. Eläimistä 3,571 sonnia ja 16,186 lehmää oli genotyypitettyjä. MF-kovarianssimatriisi (Γ) luotiin käyttäen peruspopulaation alleelifrekvenssejä, jotka laskettiin käyttäen kullekin eläimelle yhden sukupolven sukupuusyvyyttä. Estimoinnin jälkeen DNA-merkkien valintaan käytettiin harvinaisemman alleelin yleisyyden raja-arvoa (MAF) 0.05. Genomisen sukulaisuusmatriisin diagonaalielementtien korrelaatio tavanomaisen sukulaisuusmatriisin (A) diagonaalielementtien kanssa oli matalampi (A; 0.66) kuin Γ-matriisin diagonaalielementtien korrelaatio A:n diagonaalielementtien kanssa (A^Γ; 0.76). Sonnien maitotuotoksen R2 nousi 0.04 yksikköä kun MF-menetelmä otettiin käyttöön (0.27:sta 0.31:een). Lehmillä vastaava parannus oli 0.01 yksikköä (0.36:sta 0.37:een).
Subject: animal genetics and breeding
Rights: This publication is copyrighted. You may download, display and print it for Your own personal use. Commercial use is prohibited.


Files in this item

Total number of downloads: Loading...

Files Size Format View
kudinov_andrei_dissertation_2021.pdf 663.0Kb PDF View/Open

This item appears in the following Collection(s)

Show full item record