Using genome-wide association studies to map genes for complex traits in porcine F2 crosses

Autor: Schmid, Markus
Jazyk: angličtina
Rok vydání: 2018
Předmět:
Popis: In the era of genomics, genome-wide association studies (GWASs) have become the method of choice for gene mapping. This is still of great interest to infer the genetic architecture of quantitative traits and to improve genomic selection in animal breeding. Formerly, linkage analyses were conducted in order to map genes. Therefore, many F2 cross populations were generated by crossing genetically divergent lineages in order to create informative experimental populations. However, a small number of markers and the limited meiotic divisions led to imprecise mapping results. The main objective of the present study was to investigate the use of existing porcine F2 cross data, extended towards single nucleotide polymorphism (SNP) chip genotype information, for quantitative trait loci (QTL) mapping in the genomic era. A special focus was on mapping genes that also segregate within the Piétrain breed since this is an important sire line and genomic selection is applied in this breed. Chapter 1 is a review article of statistical models and experimental populations applied in GWASs. This chapter gives an overview of methods to conduct GWASs using single-marker models and multi-marker models. Further, approaches taking non-additive genetic effects or genotype-by-environment interactions into account are described. Finally, post-GWAS analysis possibilities and GWAS mapping populations are discussed. In chapter 2, the power and precision of GWASs in different F2 populations and a segregating population was investigated using simulated whole-genome sequence data. Further, the effect of pooling data was determined. GWASs were conducted for simulated traits with a heritability of 0.5 in F2 populations derived from closely and distantly related simulated founder breeds, their pooled datasets, and a sample of the common maternal founder breed. The study showed that the mapping power was high (low) in F2 crosses derived from distantly (closely) related founder breeds and highest when several F2 datasets were pooled. By contrast, a low precision was observed in the cross with distantly related founder breeds and the pooling of data led to a precision that was between the two crosses. For genes that also segregated within the common founder breed, the precision was generally elevated and, at equal sample size, the power to map QTL was even higher in F2 crosses derived from closely related founder breeds compared with the founder breed itself. Within and across linkage disequilibrium (LD) structures of such F2 populations were examined in chapter 3 by separately and jointly (pooled dataset) analyzing four F2 datasets generated from different founder breeds. All individuals were genotyped with a 62k SNP chip. The LD decay was faster in crosses derived from closely related founder breeds compared with crosses from phylogenetically distantly related founder populations and fastest when the data of all crosses were pooled. The pooled dataset was also used to map QTL for the economically important traits dressing out and conductivity applying single-marker and Bayesian multi-marker regressions. For these traits, several genome-wide significant association signals were mapped. To infer the suitability of F2 data to map genes in a segregating breeding population, GWAS results of a pooled F2 cross were validated in two samples of the German Piétrain population (chapter 4). All individuals were genotyped using standard 62k SNP chips. The pooled cross contained the data of two F2 crosses, both had Piétrain as one founder breed, and consisted of 595 individuals. Initially, GWASs were conducted in the pooled F2 cross for the production traits dressing yield, carcass length, daily gain and drip loss. Subsequently, QTL core regions around significant trait associated peaks were defined. Finally, SNPs within these core regions were tested for association in the two samples of the current Piétrain population (771 progeny tested boars and 210 sows) in order to validate them in this breed. In total, 15 QTL were mapped and 8 (5) of them were validated in the boar (sow) validation dataset. This approach takes advantage of the high mapping power in F2 data to detect QTL that may not be found in the segregating Piétrain population. The findings showed that many of the QTL mapped in F2 crosses derived from Piétrain still segregate in this breed, and thus, these F2 datasets provide a promising database to map QTL in the Piétrain breed. The thesis ends with a general discussion. Genomweite Assoziationsstudien (GWASs) wurden zur Methode der Wahl für die Genkartierung und sind von großem Interesse, um die genetische Architektur von quantitativen Merkmalen abzuleiten und die genomische Selektion in der Tierzucht zu verbessern. Früher wurden dafür Kopplungsanalysen durchgeführt, für welche experimentelle Populationen, z.B. F2-Kreuzpopulationen aus genetisch divergenten Ausgangslinien, erzeugt wurden. Die geringe Markeranzahl und die begrenzte Anzahl von Meiosen limitierte jedoch den Kartierungserfolg in solchen Studien. Hauptziel der vorliegenden Studie war es, die Verwendung vorhandener porciner F2-Kreuzungsdaten, welche auf SNP-Chip-Genotypinformation (Einzelnukleotidpolymorphismus, engl.: single nucleotide polymorphism, SNP) erweitert wurden, für die QTL-Kartierung (quantitativer Merkmalsgenort, engl.: quantitative trait loci, QTL) im genomischen Zeitalter zu untersuchen. Ein besonderer Schwerpunkt war die Kartierung von Genen, die auch innerhalb der wichtigen Vaterrasse Piétrain segregieren. Kapitel 1 ist ein Übersichtsartikel über statistische Modelle und experimentelle Populationen, die in GWASs Anwendung finden. Er gibt einen Überblick über Methoden zur Durchführung von GWASs mit Einzel- und Multimarkermodellen. Ferner wurden Ansätze beschrieben, die nichtadditive genetische Effekte oder Genotyp-Umwelt-Interaktionen berücksichtigen. Final wurden post-GWAS Analysemöglichkeiten und Kartierungspopulationen für GWASs diskutiert. In Kapitel 2 wurden die Power und Präzision von GWASs in verschiedenen F2-Populationen und einer segregierenden Population unter Verwendung simulierter Gesamtgenom-Sequenzdaten untersucht. Außerdem wurde der Effekt des Poolens von Daten ermittelt. Es wurden GWASs für simulierte Merkmale mit einer Heritabilität von 0,5 in F2-Populationen, die von nah- und fernverwandten simulierten Ausgangsrassen abstammen, ihren gepoolten Datensätzen und einer Stichprobe der gemeinsamen maternalen Ausgangsrasse, durchgeführt. Die Studie zeigte, dass die Power zur Genkartierung in F2-Kreuzungen mit fern- bzw. nahverwandten Ausgangsrassen hoch bzw. niedrig war, und am höchsten, wenn mehrere F2-Datensätze gepoolt waren. In F2-Kreuzungen mit fernverwandten Ausgangsrassen wurde eine geringe Kartierungspräzision beobachtet. Das Poolen von Daten führte zu einer Genauigkeit, die zwischen den beiden Kreuzungen lag. Für Gene, die auch innerhalb der gemeinsamen Ausgangsrasse segregierten war die Präzision generell erhöht und bei gleichem Stichprobenumfang war die Fähigkeit QTL zu kartieren, in F2-Kreuzungen die von nahverwandten Ausgangslinien abstammten, im Vergleich zur Ausgangsasse selbst, noch höher. Kopplungsungleichgewichtsstrukturen innerhalb solcher F2-Populationen und über F2-Populationen hinweg wurden in Kapitel 3 untersucht, indem vier F2-Datensätze mit verschiedenen Ausgangsrassen separat und gemeinsam analysiert wurden. Alle Individuen wurden mit einem 62k SNP-Chip genotypisiert. Der LD-Zerfall (Kopplungsungleichgewicht, engl.: linkage disequilibrium, LD) war bei Kreuzungen, die von nahverwandten Ausgangsrassen abstammten schneller als bei Kreuzungen aus phylogenetisch fernverwandten Ausgangspopulationen, und am schnellsten, wenn die Daten aller Kreuzungen gepoolt wurden. Der gepoolte Datensatz wurde auch genutzt, um QTL für die ökonomisch wichtigen Merkmale, Schlachtausbeute sowie Leitfähigkeit, unter Anwendung von Singlemarker- und Bayes-Multimarker-Regressionen, zu kartieren. Für diese Merkmale kartierten wir mehrere genomweit signifikante Assoziationssignale. Um die Eignung von F2-Daten für die Genkartierung in einer segregierenden Zuchtpopulation abzuleiten, wurden GWAS-Ergebnisse einer gepoolten F2-Kreuzung in zwei Stichproben der aktuellen deutschen Piétrainpopulation (771 Nachkommen-geprüfte Eber, 210 Sauen) validiert (Kapitel 4). Alle Individuen wurden mit 62k SNP-Chips genotypisiert. Die gepoolte Kreuzung enthielt die Daten zweier F2-Kreuzungen, welche beide Piétrain als eine Ausgangsrasse hatten, und bestand aus 595 Individuen. Zuerst wurden GWASs in der gepoolten F2-Kreuzung für die Produktionsmerkmale Schlachtausbeute, Schlachtkörperlänge, Tageszunahme und Tropfsaftverlust durchgeführt. Anschließend wurden QTL-Kernregionen um signifikante merkmalsassoziierte Peaks definiert und in den beiden Piétrainpopulationen auf Assoziation getestet, um sie in dieser Rasse zu bestätigen. Insgesamt wurden 15 QTL kartiert und 8 bzw.5 im Eber- bzw. Sauenvalidierungsdatensatz bestätigt. Dieser Ansatz nutzt die große Teststärke in F2-Daten um QTL zu detektieren, die möglicherweise in der Piétrainpopulation nicht gefunden werden würden. Die Ergebnisse zeigten, dass viele der QTL die in von Piétrain abstammenden F2-Kreuzungen kartiert wurden, noch immer in dieser Rasse segregieren. Somit bieten diese F2-Datensätze eine vielversprechende Datengrundlage zur QTL-Kartierung in der Rasse Piétrain. Die Arbeit endet mit einer allgemeinen Diskussion.
Databáze: OpenAIRE