Comparação de métodos de priorização de genes associados a transtornos do neurodesenvolvimento

Autor: Feltrin, Arthur Sant'Anna
Jazyk: portugalština
Rok vydání: 2016
Předmět:
Zdroj: Repositório Institucional da UFABCUniversidade Federal do ABCUFABC.
Druh dokumentu: masterThesis
Popis: Orientador: David Corrêa Martins Júnior
Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Neurociência e Cognição, 2016.
A biologia sistêmica é um campo de pesquisa interdisciplinar que estuda as complexas interações que ocorrem entre os componentes biológicos de um organismo vivo com o objetivo de entender o seu comportamento, o qual emerge a partir dessas interações. Essas interações compõem uma rede altamente complexa, cujos interagentes podem ser de diversas naturezas. Nesse contexto, as doenças complexas são caracterizadas justamente por serem poligênicas e multifatoriais, ou seja, a gênese e o desenvolvimento dessas doenças são uma consequência da interação conjunta de diversos fatores, incluindo não apenas genes, proteínas e outras moléculas, como também fatores epigenéticos e ambientais. No entanto, diferentes métodos de priorização gênica apresentam resultados (listas de genes) com baixa convergência. Assim, a comparação desses métodos é uma questão crucial. Os objetivos principais da presente dissertação foram a realização de uma extensa revisão da literatura em relação às técnicas de priorização de genes associados a doenças complexas e a comparação de algumas dessas técnicas. Foram selecionadas duas ferramentas: o WGCNA (Weighted Gene Correlation Network Analysis) e o NERI (Network-Medicine Relative Importance), ambos métodos que baseiam-se em teoria de redes complexas e co-expressão para priorização gênica, sendo que o NERI tem o diferencial de modelar as hipóteses da Network Medicine para priorização com base na integração de dados de expressão, de redes de interação proteína-proteína (PPI) e de estudos de associação. Para comparação dos resultados, foram utilizados três bancos de dados de expressão gênica relacionados a esquizofrenia. Como previsto, devido ao diferencial de integração de dados proposto pelo NERI, tal técnica resultou em listas de genes com replicação superior à obtida pelo WGCNA para os três bancos de dados em questão. Além disso a interseção entre as listas de genes priorizados de cada metodologia foi baixa, com poucos genes sendo compartilhados pelos resultados dos dois métodos. Ambas metodologias selecionaram genes com relevância biológica relacionada a esquizofrenia, incluindo grupos de genes relacionados a atividade do sistema imune (infecções, estresse), atividade do Sistema Nervoso Central (atividade sináptica, crescimento axonal) e também de embriogênese. Baseando-se nesses resultados, conclui-se que a análise de redes e a integração de dados biológicos são fundamentais para uma ferramenta apresentar resultados promissores, sobretudo no âmbito da descoberta de novos genes e suas redes de interação biológica que seriam possivelmente desconhecidas se fosse realizada apenas a análise individual de cada tipo de dado biológico disponível.
Systems Biology is an interdisciplinary research field which studies the complex interactions that occur between biological compounds of a living organism in order to understand their behavior, which emerges from these interactions. Such interactions compose a highly complex network, whose elements can be of several types. In this context, complex diseases are characterized precisely by being of polygenic and multifactorial nature, i.e., the genesis and development of these diseases are a result of the joint interaction of several factors, including not only genes, proteins and other molecules, but also epigenetic and environmental factors. However, many methods for gene prioritization present results (list of genes) with small convergence. Thus, the comparison involving those methods is a crucial issue. The main objectives of this master thesis was to perform an extensive literature review related to gene prioritization techniques associated to complex diseases and the comparison of part of these techniques. Two techniques were selected: WGCNA (Weighted Gene Correlation Network Analysis) and NERI (Network-Medicine Relative Importance), both methods based on complex networks theory and co-expression for gene prioritization, but NERI having the differential of modeling the Network Medicine hypotheses for prioritization based on integration of expression, protein-protein interaction (PPI) network and association studies. For comparison of the results, three gene expression databases related to schizophrenia were adopted. As predicted, due to the data integration proposed by NERI, such technique resulted in genes lists with superior replication for the three databases mentioned. Additionally, the intersection between the results of the genes lists prioritized by the two methodologies was small, with few genes being found in both lists. Both methods selected biologically relevant to schizophrenia, including groups of genes related to imune system activity (infections, stress), Central Nervous System activity (synaptic activity, axonal growth) and embryogenesis. From these results, it follows that network analysis and biological data integration are fundamental for a gene prioritization method to present promising results, mainly for discovery of new genes and their biological interaction networks that would possibly be unknown if only an individual analysis of each biological data available were performed.
Databáze: Networked Digital Library of Theses & Dissertations