Prédiction de transcriptome : analyse comparative multi-gènes, orthologues

Autor: Guillaudeux, Nicolas
Přispěvatelé: Dynamics, Logics and Inference for biological Systems and Sequences (Dyliss), Inria Rennes – Bretagne Atlantique, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-GESTION DES DONNÉES ET DE LA CONNAISSANCE (IRISA-D7), Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Université de Rennes 1 (UR1), Université de Rennes (UNIV-RENNES)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes 1 (UR1), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Institut de Recherche en Informatique et Systèmes Aléatoires (IRISA), Institut National des Sciences Appliquées (INSA)-Université de Rennes (UNIV-RENNES)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique Bretagne-Pays de la Loire (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT), Univ Rennes, Inria, CNRS, Irisa, Catherine Belleannée, Samuel Blanquart, Dyliss, Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-Institut National de Recherche en Informatique et en Automatique (Inria)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-Université de Rennes (UR)-Institut National des Sciences Appliquées - Rennes (INSA Rennes), Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Université de Bretagne Sud (UBS)-École normale supérieure - Rennes (ENS Rennes)-CentraleSupélec-Centre National de la Recherche Scientifique (CNRS)-IMT Atlantique (IMT Atlantique)
Jazyk: francouzština
Rok vydání: 2018
Předmět:
Zdroj: Bio-informatique [q-bio.QM]. 2018
Popis: The formation of eukaryotic gene transcripts is due to an alternative splicing process that selects some regions, called exons, in which some will be translated into proteins. Partners of this study have developed a method for predicting transcripts called CG-Alcode, taking advantage of the conservation principle of sequences of the same gene between two species (called orthologous genes). This work aims to extend the method in order to deal with multi-species comparison, first based on three study species (human, mouse and dog). The study involves a cohort of 2,167 triplets of orthologous genes and is illustrated on one gene in particular : the CREM gene. The protocol used reinjects transcript predictions of an expressible source gene into the target species’ repertory. This aims to complete current knowledge and to annotate the transcriptome of the species, especially the dog transcriptome, which is still poorly documented. 7,201 transcriptsare predicted that way. From there, the construction of orthology relationship graphs was implemented to provide an overview on the evolution of genes and their expressed transcripts. 83 orthologous gene triplets were found as having an identical fine gene structure between the three species, these gene triplets have been shared since the ancestor Eutheria. These results thus show a first track of understanding evolution, in terms of information gain and loss, in gene structures.; La formation des transcrits à partir des gènes eucaryotes est due à un processus d’épissage alternatif qui sélectionne une partie des régions, les exons, dans lesquels certains seront traduits en protéines. Des partenaires de cette étude ont développé une méthode de prédiction des transcrits baptisée CG-Alcode, qui exploite le principe de conservation de séquences d’un même gène entre deux espèces (dits "gènes orthologues"). Ces travaux ont pour objectif d'étendre l'approche comparative pairwise à de la comparaison multi-espèces, en se basant sur trois espèces d’étude (homme, souris et chien). L’étude porte sur une cohorte de 2 167 triplets de gènes orthologues et est illustrée sur un gène en particulier : le gène CREM. Le protocoleemployé réinjecte les prédictions de transcrits d’un gène source exprimable chez un gène cible dans le répertoire de l’espèce cible. Cela vise à compléter les connaissances actuelles et à annoter le transcriptome des espèces, en particulier celui du chien encore peu documenté. 7 201 transcrits sont ainsi prédits. A partir de là, la construction de graphes de relations d’orthologie a été mise en place pour apporter une vision sur l’évolution des gènes et sur leurs transcrits exprimés. 83 triplets de gènes orthologues ont pu être retrouvés comme présentant une structure fine de gène identique entre les trois espèces, partagée depuis l’ancêtre Eutheria. Ces résultats montrent ainsi une première piste de compréhension en terme d'évolution (gain et de perte d’information) dans les structures de gènes.
Databáze: OpenAIRE