A chromosome-level, haplotype-phased Vanilla planifolia genome highlights the challenge of partial endoreplication for accurate whole-genome assembly

Autor: Piet, Quentin, Droc, Gaetan, Marande, William, Sarah, Gautier, Bocs, Stéphanie, Klopp, Christophe, Bourge, Mickael, Siljak-Yakovlev, Sonja, Bouchez, Olivier, Lopez-Roques, Céline, Lepers-Andrzejewski, Sandra, Bourgois, Laurent, Zucca, Joseph, Dron, Michel, Besse, Pascale, Grisoni, Michel, Jourda, Cyril, Charron, Carine
Přispěvatelé: Peuplements végétaux et bioagresseurs en milieu tropical (UMR PVBMT), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut de Recherche pour le Développement (IRD)-Université de La Réunion (UR)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Amélioration génétique et adaptation des plantes méditerranéennes et tropicales (UMR AGAP), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut Agro Montpellier, Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Institut national d'enseignement supérieur pour l'agriculture, l'alimentation et l'environnement (Institut Agro)-Université de Montpellier (UM), Département Systèmes Biologiques (Cirad-BIOS), Centre de Coopération Internationale en Recherche Agronomique pour le Développement (Cirad), South Green Bioinformatics Platform [Montpellier], Centre National de Ressources Génomiques Végétales (CNRGV), Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Plateforme Bio-Informatique - Génotoul, Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Université de Toulouse (UT)-Ecole Nationale Vétérinaire de Toulouse (ENVT), Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Université de Toulouse (UT)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Université Toulouse III - Paul Sabatier (UT3), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRAE), Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-BioInfOmics, Unité de Mathématiques et Informatique Appliquées de Toulouse (MIAT INRAE), Institut de Biologie Intégrative de la Cellule (I2BC), Commissariat à l'énergie atomique et aux énergies alternatives (CEA)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Ecologie Systématique et Evolution (ESE), AgroParisTech-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS), Génome et Transcriptome - Plateforme Génomique ( GeT-PlaGe), Plateforme Génome & Transcriptome (GET), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Génopole Toulouse Midi-Pyrénées [Auzeville] (GENOTOUL), Université de Toulouse (UT)-Institut National de la Santé et de la Recherche Médicale (INSERM)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), Etablissement public Vanille de Tahiti, Eurovanille, V. Mane Fils, 620 route de Grasse, 06620 Le Bar sur Loup, France., Institut des Sciences des Plantes de Paris-Saclay (IPS2 (UMR_9213 / UMR_1403)), Université d'Évry-Val-d'Essonne (UEVE)-Université Paris-Saclay-Centre National de la Recherche Scientifique (CNRS)-Université Paris Cité (UPCité)-Institut National de Recherche pour l’Agriculture, l’Alimentation et l’Environnement (INRAE), This work was supported by grants from Eurovanille and V. Mane Fils companies. The research was co-funded by the Centre de Coopération Internationale en Recherche Agronomique pour le Développement (CIRAD), the Université de La Réunion (UR), the Institut National de Recherche pour l’Agriculture l’Alimentation et l’Environnement (INRAE), the Centre National de la Recherche Scientifique (CNRS), and the Etablissement Vanille de Tahiti (EVT). This work was also supported by grants from the European Regional Development Fund (ERDF), the Conseil Régional de la Réunion, and the Conseil Départemental de la Réunion. This work was supported by France Génomique National infrastructure, funded as part of 'Investissement d’avenir' program managed by Agence Nationale pour la Recherche (ANR-10-INBS-0009, France Génomique) and has also benefited from Imagerie-Gif core facility, supported by l’Agence Nationale de la Recherche (ANR-11-EQPX-0029 Morphoscope 2, ANR-10-INBS-04 France BioImaging, ANR-11-IDEX-0003-02 IDEX Paris-Saclay)., ANR-10-INBS-0009,France-Génomique,Organisation et montée en puissance d'une Infrastructure Nationale de Génomique(2010), ANR-11-EQPX-0029,MORPHOSCOPE 2,Imagerie et reconstruction multiéchelles de la morphogenèse. (Plateforme d'innovation technologique et méthodologique pour l'imagerie in vivo et la reconstruction des dynamiques multiéchelles de la morphogenèse)(2011), ANR-10-INBS-0004,France-BioImaging,Développment d'une infrastructure française distribuée coordonnée(2010), ANR-11-IDEX-0003,IPS,Idex Paris-Saclay(2011)
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Zdroj: Plant Communications
Plant Communications, 2022, 3 (5), pp.100330. ⟨10.1016/j.xplc.2022.100330⟩
ISSN: 2590-3462
Popis: International audience; Vanilla planifolia, the species cultivated to produce one of the world’s most popular flavors, is highly prone to partial genome endoreplication, which leads to highly unbalanced DNA content in cells. We report here the first molecular evidence of partial endoreplication at the chromosome scale by the assembly and annotation of an accurate haplotype-phased genome of V. planifolia. Cytogenetic data demonstrated that the diploid genome size is 4.09 Gb, with 16 chromosome pairs, although aneuploid cells are frequently observed. Using PacBio HiFi and optical mapping, we assembled and phased a diploid genome of 3.4 Gb with a scaffold N50 of 1.2 Mb and 59 128 predicted protein-coding genes. The atypical k-mer frequencies and the uneven sequencing depth observed agreed with our expectation of unbalanced genome representation. Sixty-seven percent of the genes were scattered over only 30% of the genome, putatively linking gene-rich regions and the endoreplication phenomenon. By contrast, low-coverage regions (non-endoreplicated) were rich in repeated elements but also contained 33% of the annotated genes. Furthermore, this assembly showed distinct haplotype-specific sequencing depth variation patterns, suggesting complex molecular regulation of endoreplication along the chromosomes. This high-quality, anchored assembly represents 83% of the estimated V. planifolia genome. It provides a significant step toward the elucidation of this complex genome. To support post-genomics efforts, we developed the Vanilla Genome Hub, a user-friendly integrated web portal that enables centralized access to high-throughput genomic and other omics data and interoperable use of bioinformatics tools.
Databáze: OpenAIRE