RRBS-toolkit
Autor: | Piumi, Francois, Jouneau, Luc, gasselin, Maxime, Perrier, Jean-Philippe, Al Adhami, Hala, Jammes, Hélène, Kiefer, Hélène |
---|---|
Přispěvatelé: | Biologie du Développement et Reproduction (BDR), École nationale vétérinaire d'Alfort (ENVA)-Institut National de la Recherche Agronomique (INRA), Université Paris-Saclay, UMR ESBS, Centre National de la Recherche Scientifique (CNRS) |
Jazyk: | francouzština |
Rok vydání: | 2017 |
Předmět: | |
Zdroj: | 3. Journée de Séminaires du Département Phase sur l'Epigénétique EpiPhase 3. Journée de Séminaires du Département Phase sur l'Epigénétique EpiPhase, May 2017, Jouy-en-Josas, France. 1 p |
Popis: | Nous avons développé un nouveau pipeline bioinformatique pour l’analyse du méthylome des animaux d’élevage à partir de données issues de RRBS (Reduced Representation Bisulfite Sequencing). Ce pipeline est le fruit d’un travail collaboratif étroit entre biologistes et bioinformaticiens de l’Unité et a permis de produire des résultats biologiques validés expérimentalement (voir Perrier et al. pour des exemples). Le pipeline peut dans un premier temps être exploité pour générer des génomes réduits in silico (« RR génomes ») en utilisant différents sites de restriction et des tailles de fragment variables. Un script original annote les CpGs couverts et détermine leurs caractéristiques génomiques ou leur présence dans des îlots CpG. Ces RR génomes permettent d’optimiser en amont le design expérimental en fonction du nombre de CpG couverts et de leur annotation. Après séquençage des banques RRBS, le logiciel Trim galore1 permet d’effectuer un contrôle qualité des séquences et de supprimer les adaptateurs de séquençage. L’alignement des séquences sur le génome de référence est réalisé à l’aide du logiciel Bismark2 qui prend en compte la conversion de l’ADN au bisulfite de sodium. Nous avons ensuite développé une série de scripts de contrôle qualité, comme le calcul de la distance entre deux reads issus d’un même fragment (en paired-end) ou la distribution de la couverture, ainsi qu’un script permettant de réaliser des analyses descriptives de manière intégrée. Pour des comparaisons impliquant des réplicats, les CpG différentiellement méthylés (DMC) sont identifiés à l’aide du package R MethylKit3 à partir des sorties du module d’extraction de méthylation de Bismark. Pour des comparaisons sans réplicats, nous avons conçu un script qui identifie les DMC « évidents » satisfaisant une différence de méthylation minimale entre les conditions. Un script a aussi été développé pour identifier les régions différentiellement méthylées (DMR) à partir de DMC voisines. Les DMC et les DMR sont ensuite annotées selon leurs caractéristiques génomiques et leur présence dans des îlots CpG, la distribution obtenue étant comparée avec celle de l’ensemble des CpG analysés afin d’identifier des enrichissements. Ce pipeline hautement paramétrable et facile à utiliser pour les biologistes est employé en routine au laboratoire pour analyser le méthylome de différents tissus bovins et de lapin4. Il peut également être appliqué à d’autres espèces ou adapté à des données de WGBS (Whole Genome Bisulfite Sequencing). Nous présentons ici des résultats obtenus à partir de données RRBS porcines publiées5. Ce pipeline offre donc une solution complète d’analyse de données de méthylation, de l’aide à la mise en place du design expérimental jusqu’à l’identification et la caractérisation de DMC et de DMR, et a été mis à disposition de la communauté FAANG |
Databáze: | OpenAIRE |
Externí odkaz: |