The inference of gene trees with species trees

Autor: Gergely J. Szöllősi, Bastien Boussau, Eric Tannier, Vincent Daubin
Přispěvatelé: Bioinformatique, phylogénie et génomique évolutive (BPGE), Département PEGASE [LBBE] (PEGASE), Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE), Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS), Biophysics Research Group [Budapest] (ELTE-MTA 'Lendület'), Hungarian Academy of Sciences (MTA), Artificial Evolution and Computational Biology (BEAGLE), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2), French Agence Nationale de la Recherche (ANR) [ ANR-10-BINF-01-01], Marie Curie 'Genestory' [CIG 618438], Albert Szent-Gyorgyi Call-Home Researcher Scholarship [A1-SZGYA-FOK-13-0005], European Union, State of Hungary, European Social Fund [TAMOP 4.2.4.A/1-11-1-2012-0001], Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Université de Lyon-Université de Lyon-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Lumière - Lyon 2 (UL2)-École Centrale de Lyon (ECL), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Inria Grenoble - Rhône-Alpes, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire de Biométrie et Biologie Evolutive - UMR 5558 (LBBE), Université de Lyon-Université de Lyon-Institut National de Recherche en Informatique et en Automatique (Inria)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)-VetAgro Sup - Institut national d'enseignement supérieur et de recherche en alimentation, santé animale, sciences agronomiques et de l'environnement (VAS)-Centre National de la Recherche Scientifique (CNRS)
Rok vydání: 2015
Předmět:
0106 biological sciences
Genome evolution
Bayesian inference
Biology
010603 evolutionary biology
01 natural sciences
species tree
Coalescent theory
03 medical and health sciences
birth–death model
Computational phylogenetics
Gene duplication
Genetics
maximum likelihood
gene transfer
Quantitative Biology - Populations and Evolution
hybridization
Ecology
Evolution
Behavior and Systematics

030304 developmental biology
dynamic programming
0303 health sciences
Phylogenetic tree
gene duplication
Populations and Evolution (q-bio.PE)
Phylogenetic network
gene loss
coalescent
Tree (graph theory)
[SDV.BIBS]Life Sciences [q-bio]/Quantitative Methods [q-bio.QM]
Algorithm
phylogenetics
gene tree
Evolutionary biology
Tree rearrangement
amalgamation
FOS: Biological sciences
Special Issue: Mathematical and Computational Evolutionary Biology (2013)
[INFO.INFO-BI]Computer Science [cs]/Bioinformatics [q-bio.QM]
Zdroj: Systematic Biology
Systematic Biology, Oxford University Press (OUP), 2015, Special Issue: Mathematical and Computational Evolutionary Biology (2013), 64 (1), pp.e42-e62. ⟨10.1093/sysbio/syu048⟩
Systematic Biology, 2015, Special Issue: Mathematical and Computational Evolutionary Biology (2013), 64 (1), pp.e42-e62. ⟨10.1093/sysbio/syu048⟩
ISSN: 1063-5157
1076-836X
DOI: 10.1093/sysbio/syu048⟩
Popis: Molecular phylogeny has focused mainly on improving models for the reconstruction of gene trees based on sequence alignments. Yet, most phylogeneticists seek to reveal the history of species. Although the histories of genes and species are tightly linked, they are seldom identical, because genes duplicate, are lost or horizontally transferred, and because alleles can co-exist in populations for periods that may span several speciation events. Building models describing the relationship between gene and species trees can thus improve the reconstruction of gene trees when a species tree is known, and vice-versa. Several approaches have been proposed to solve the problem in one direction or the other, but in general neither gene trees nor species trees are known. Only a few studies have attempted to jointly infer gene trees and species trees. In this article we review the various models that have been used to describe the relationship between gene trees and species trees. These models account for gene duplication and loss, transfer or incomplete lineage sorting. Some of them consider several types of events together, but none exists currently that considers the full repertoire of processes that generate gene trees along the species tree. Simulations as well as empirical studies on genomic data show that combining gene tree-species tree models with models of sequence evolution improves gene tree reconstruction. In turn, these better gene trees provide a better basis for studying genome evolution or reconstructing ancestral chromosomes and ancestral gene sequences. We predict that gene tree-species tree methods that can deal with genomic data sets will be instrumental to advancing our understanding of genomic evolution.
Comment: Review article in relation to the "Mathematical and Computational Evolutionary Biology" conference, Montpellier, 2013
Databáze: OpenAIRE