Statistical analysis of networks of associations between microbial species from metagenomic data

Autor: Cougoul, Arnaud
Přispěvatelé: Unite d'Epidemiologie Animale, Institut National de la Recherche Agronomique (INRA), Université Clermont Auvergne [2017-2020], Gwenaël Vourc'h
Jazyk: francouzština
Rok vydání: 2019
Předmět:
Zdroj: Génomique, Transcriptomique et Protéomique [q-bio.GN]. Université Clermont Auvergne [2017-2020], 2019. Français. ⟨NNT : 2019CLFAC103⟩
Popis: High throughput sequencing reveals a new ecology of microorganisms. They are everywhere and their functions are essential for their host ecosystems, organisms or environments. Metagenomics makes it possible to estimate the composition and abundance of microbial species from a set of samples of the same type of microbial communities. In the studies that seek to understand the diversity and structure of such communities, network approaches can identify statistical associations between microbes, assuming that these statistical associations reflect biological interactions. In this context, the subject of my thesis was to better understand the potential of network approaches in the detection of associations between OTUs within metagenomic data and to develop the necessary tools to improve the analysis of datasets. As a first step, I studied the practices and analysis tools that can be used to infer association networks within metagenomes. Given the properties of metagenomic data, I determined their effectiveness and their limits. This work allowed me to identify ways to improve the study of microbial associations. Based on the accumulated knowledge, I developed an association analysis package between OTUs (named MAGMA) to infer relevant associations within metagenomes. MAGMA takes into account the specificities of metagenomic data and offers the possibility to take into account the effect of a structuring factor on the distribution of OTUs before looking for associations between microbes. Through participations in different metagenomics projects, I confirmed the relevance of the tool developed and identified ways of improving the current biological issues.; Le séquençage haut débit révèle une nouvelle écologie des microorganismes. Ils sont présents partout et leurs fonctions sont primordiales pour leurs écosystèmes hôtes, organismes ou environnements. La métagénomique permet notamment d'estimer la composition et l'abondance des espèces microbiennes d'un ensemble d'échantillons de même type de communautés microbiennes. Lors d'études cherchant à comprendre la diversité et la structure de telles communautés, des approches réseaux permettent d'identifier des associations statistiques entre microbes, en faisant l'hypothèse que ces associations statistiques reflètent les interactions biologiques. Dans ce contexte, le sujet de ma thèse était de mieux cerner le potentiel des approches réseaux dans la détection d'associations entre OTUs au sein de données métagénomiques et de développer les outils nécessaires pour améliorer l'analyse des jeux de données. Dans un premier temps, j'ai étudié les pratiques et les outils d'analyse utilisables pour inférer des réseaux d'associations au sein de métagénomes. Compte-tenu des propriétés des données métagénomiques, j'ai déterminé leur efficacité et leurs limites. Ces travaux m'ont permis de déterminer des pistes pour améliorer l'étude des associations microbiennes. Sur la base des connaissances accumulées, j'ai développé un package d'analyse des associations entre OTUs (nommé MAGMA) visant à inférer les associations pertinentes au sein de métagénomes. MAGMA prend en compte les spécificités des données métagénomiques et offre la possibilité de prendre en compte l'effet d'un facteur structurant sur la distribution des OTUs avant de rechercher les associations entre microbes. Par le biais de participations dans différents projets de métagénomique, j'ai confirmé la pertinence de l'outil développé et identifié des pistes d'améliorations permettant de faire face aux problématiques biologiques actuelles.
Databáze: OpenAIRE