Estudo de bioinformática aplicado à análise de expressão gênica utilizando dados oriundos de sequenciamento por tecnologia de 'Next-Generation' em animais controle e em modelos de epilepsia do lobo temporal mesial

Autor: Brumatti Gonçalves, Kátia Cristiane, 1976
Přispěvatelé: Lopes-Cendes, Íscia Teresinha, 1964, Rocha, Cristiane de Souza, 1978, Morelli, Claudia Vianna Maurer, Godard, Ana Lúcia Brunialti, Universidade Estadual de Campinas. Faculdade de Ciências Médicas, Programa de Pós-Graduação em Fisiopatologia Médica, UNIVERSIDADE ESTADUAL DE CAMPINAS
Rok vydání: 2021
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
Popis: Orientadores: Íscia Teresinha Lopes Cendes, Cristiane de Souza Rocha Dissertação (mestrado) - Universidade Estadual de Campinas, Faculdade de Ciências Médicas Resumo: O campo da bioinformática associada à Next Generation Sequencing (NGS) ainda está em estado imaturo. A técnica de microarray tem sido muito utilizada nas últimas décadas em estudos de níveis de expressão de genes, porém essa técnica possui limitações. Sequenciamento de RNA (RNA-Seq) tem vantagens sobre as abordagens atuais, pois permite que o transcriptoma inteiro seja pesquisado com alto rendimento, fazendo com que RNA-Seq seja útil para estudar transcriptomas complexos, além disso, permite a análise de splicing alternativo. Muitas ferramentas têm sido desenvolvidas para abordar diferentes aspectos da análise de dados em RNA-Seq, e sua análise é um desafio constante. Nesse contexto, o objetivo deste estudo foi utilizar métodos de bioinformática para a análise de expressão gênica utilizando dados de RNA-Seq. Para isso, foram utilizados dados brutos obtidos em dois experimentos diferentes: a) utilizando animais normais, na qual a análise comparativa foi realizada da região do hipocampo (CA1, CA2 e CA3) e giro denteado, e b) utilizando animais tratados com pilocarpina e animais controle. Na análise dos dois experimentos, foram encontrados 3 genes (Nnat, Sv2b e Neurod6) em comum que tem diferença na expressão, ambos genes tem envolvimento no sistema nervoso central. Na análise de splicing alternativo, a ferramenta MISO (Mixture of Isoforms) comparado ao pipeline utilizado em Cuffdiff, gerou resultados melhores e mais detalhados, já que a ferramenta também realiza a quantificação dos transcritos, e com seus resultados foram descobertos 6 transcritos (Arpp21, Gria1, Gria2, Nrxn1, Dclk1 e Rtn1) em comum nas regiões do hipocampo, que tem alta expressão em giro denteado. Atualmente, existem diversos softwares em ascensão para análise diferencial, porém, o pipeline utilizado neste trabalho é ainda uma das principais ferramentas para análise de RNA-Seq, por usar algoritmos confiáveis e permitir flexibilização das análises quando necessário. Este estudo apresentou uma proposta de pipeline para a análise de expressão diferencial e identificação de splicing alternativo, para dados obtidos através de tecnologia de sequenciamento RNA-Seq. Foram identificados 5760 transcritos considerados significativamente expressos, e sugere que 6 transcritos sejam decorrentes de splicing alternativo Abstract: The field of bioinformatics associated with Next Generation Sequencing (NGS) is still in an immature state. The microarray technique has been widely used in recent decades in studies of gene expression levels, but this technique has limitations. Sequencing RNA (RNA-Seq) has advantages over current approaches because it allows the whole transcriptome is researched with high yield, making RNA-Seq be useful for studying complex transcriptomes, moreover, allows the analysis of alternative splicing. Many tools have been developed to aproach different aspects of data analysis in RNA-Seq, and its analysis is a constant challenge. In this context, the objective of this study was to use bioinformatics methods for gene expression analysis using RNA-Seq data. For this, the raw data obtained in two different experiments were used: a) using normal animalsin which was made a comparative analysis of the hippocampus (CA1, CA2 and CA3) and dentate gyrus, and b) using pilocarpine treated animals and animals control. In the analysis of two experiments, were found three genes (NNAT, Sv2b and Neurod6) in common that there is a difference in the expression, both of genes is involved in the central nervous system. In alternative splicing analysis, MISO (Mixture of Isoforms) tool compared to the pipeline used in Cuffdiff, gave better and more detailed results, as the tool also performs the quantification of transcripts, and their results were found 6 transcripts (Arpp21, Gria1, Gria2, Nrxn1, Dclk1 and Rtn1) in common in the regions of the hippocampus, which has high expression in the dentate gyrus. Currently, there are various software on the rise for differential analysis, however, the pipeline used in this work is still one of the main tools for RNA-Seq analysis, by using reliable algorithms and allow flexibility of analyzes when necessary. This study showed a pipeline proposed for the analysis of differential expression, and alternative splicing of identification data obtained for RNA-Seq sequencing technology. 5760 transcripts considered significantly expressed were identified, and suggests that 6 transcripts are derived from alternative splicing Mestrado Fisiopatologia Médica Mestra em Ciências CAPES
Databáze: OpenAIRE