Optimierung der Vorhersagen genetischer Anpassung im Zuge des Klimawandels mittels Deep Learning

Autor: Sehr, Eva Maria
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Popis: Der Klimawandel stellt eine große Bedrohung für natürliche und menschliche (Öko-)Systeme dar und ist weithin als Hauptfaktor für Verschiebungen der Verbreitungsgebiete von Arten anerkannt. Populationen, die derzeit gut an ihre Umgebung angepasst sind, können aufgrund eines sich ändernden Klimas einer Maladaption (Fehlanpassung) ausgesetzt sein und in Folge sogar aussterben. Infolgedessen ist das Verständnis der genetischen Variation, die dem Anpassungspotential an die aktuellen klimatischen Bedingungen zugrunde liegt, von entscheidender Bedeutung für eine genaue Vorhersage der Reaktionen auf zukünftige Umweltveränderungen. In der Regel werden genomweite Assoziationsstudien (’genome-wide as-sociation studies’, GWAS) durchgeführt, um die allelischen Effekte auf die Fitness basierend auf Genotyp- und Phänotyp-Daten zu ermitteln um in Folge Aussagen zur lokalen Anpassung treffen zu können. Um die Ergebnisse auf weitere unbekannte Standorte bzw. unbekannte Klimata extrapolieren zu können, wurde eine Methodik names GWES (’genome-wide environ-ment selection’) implementiert. Im Gegensatz zu GWAS basiert GWES auf maschinellem Lernen (ML), bei dem die Klimavariablen am Versuchsort sowie die Alleleffekte des Klima des Ursprungsorts der Genotypen verwendet werden. Basierend auf einem schon etablierten GWES-Modell, welches als Random Forest implementiert wurde, war das Ziel dieser Masterarbeit Neuronale Netze zu designen und vergleichend zu testen. Daher wurden verschiedene GWES-Modelle als Random Forests sowie in Form Neuronaler Netze unter Verwendung zweier ML-Umgebungen implementiert: PyTorch und scikit-learn. Ihr Vorhersagepotential wurde anhand der Hypothese verglichen, dass Deep-Learning-Algorithmen (also Neuronale Netze) im Vergleich zu Random Forests eine bessere Vorhersagbarkeit aufweisen. Dies konnte hier nur mit Neuronalen Netzen bestätigt werden, die mittels scikit-learn implementiert wurden, da diese ML-Umgebung offenbar mit Funktionen ausgestattet ist, welche durch adaptive Prozesse während des Trainings optimiert werden. Im Gegensatz zu PyTorch, ein Framework welches auf die Modellierung von komplexen ’convolutional neural net-works’ spezialisiert ist. Climate change is considered a major threat for human and natural systems and is widely recognized as key driver of shifts in species distribution and vegetation change. Populations that are currently well-adapted to their environment might face maladaptation or even extinction upon a changing climate. As a consequence, understanding the genetic variation underlying the adaptation potential to current climatic conditions is essential for an accurate prediction of responses to future environmental change. Genome-wide association studies (GWAS) are commonly used to estimate allelic effects on fitness based on genotypic and phenotypic information. To extrapolate the results of such a fitness GWAS to novel environments (or even future climates), a further approach to predict these allelic effects on fitness was implemented, so-called genome-wide environment selection (GWES). In contrast to GWAS, GWES is a machine learning (ML) approach using the climate variables at the experimental site and allele effects on the climate of the genotypes’ origin. Using an already published GWES model as baseline, which was established as random forest model, the aim of this thesis was to design and test deep neural network models that may be better in predicting fitness effects of alleles. For this purpose, various GWES models were implemented as random forests and neural networks using two ML environments, PyTorch and scikit-learn. Their performance was compared based on the hypothesis that deep learning algorithms (neural networks) have a better predictability compared to random forests. This could be confirmed only with neural networks established in scikit-learn, as this framework is equipped with functions that are well-optimized through adaptive hyperparameter tuning during training. While a useful learning exercise, PyTorch implementations may be most suitable for the development of highly customized convolutional networks vorgelegt von: Eva M. Sehr Wien, FH Campus Wien, Masterarb., 2020
Databáze: OpenAIRE