Transcriptograma em duas dimensões

Autor: Perrone, Gabriel Cury
Jazyk: portugalština
Rok vydání: 2013
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da UFRGSUniversidade Federal do Rio Grande do SulUFRGS.
Druh dokumentu: masterThesis
Popis: O conhecimento sobre o Genoma está crescendo rapidamente, assim como a quantidade de técnicas de medida da expressão gênica. É sabido que decodificar o DNA não é suficiente para entender o metabolismo celular e suas alterações, para isso, precisamos entender a expressão dos genes. Existem técnicas de medida de expressão de genoma completo, mas estas possuem ruído muito elevado, dificultando a análise dos seus resultados. Devido a isto, foram desenvolvidas técnicas para analisar estes resultados e aumentar a razão sinal-ruído; entre estas, temos o Transcriptograma. O Transcriptograma é dividido em duas etapas: o ordenamento de redes e o cálculo de médias. O ordenamento é feito por minimização de função custo, trata o Proteoma como uma rede simples e a ordena em uma lista utilizando o método de Monte Carlo para aproximar proteínas associadas. A partir da rede ordenada é possível analisar as propriedades desta, como a sua distribuição de módulos e de processos biológicos, e calcular o Transcriptograma através do cálculo das médias dos valores de expressão das proteínas dentro de uma vizinhança. Este método reduz o ruído das medidas de expressão gênica e possibilita a análise de performance celular, descrevendo o estado das células no momento da medida. Nesta dissertação, aprimoramos o método original de ordenamento alterando profundamente seu algoritmo. As modificações efetuadas reduziram em mais de mil vezes o tempo de execução do programa. As alterações obtidas abriram a possibilidade de ordenar a rede em uma dimensão qualquer, então produzimos um novo programa para obter o ordenamento da rede de proteínas em duas dimensões. Analisamos os novos resultados observando a distribuição dos módulos e de funções biológicas. A generalização do transcriptograma para duas dimensões mostra resultados melhores que os obtidos a partir do ordenamento em uma lista. Também propomos um método de seleção de amostras em duas classes e o aplicamos ao diagnóstico de Psoríase. Esse método separou claramente as amostras saudáveis das doentes. Com a rede ordenada,é possível analisar as regiões que mostram alterações no Transcriptograma e observar quais funções biológicas estão alteradas, obtendo mais informações sobre o estado celular e possibilitando a descoberta de novos alvos para fármacos.
Knowledge about the Genome is growing rapidly, as well as the number of techniques for measuring gene expression. It is known that decoding the DNA is not sufficient to understand cell metabolism and its alterations, for that we need to understand the expression of the genes. There are techniques for measuring expression of the complete genome, but these have very high noise, making it hard to analyze the results. Because of that, techniques were developed to analyze these results and increase the signal to noise ratio. Among these techniques there is the Transcriptogram. The Transcriptogram is divided into two stages: the ordering of networks and the calculation of the average of Transcriptomes. The ordering is made by minimizing a cost function, it treats the Proteome as a simple network and orders it in a list using the Monte Carlo method to make closer proteins that are associated. From the ordered network it is possible to analyze its properties, such as its modules and biological processes distribution, and calculate the Transcriptogram by calculating the mean value of protein expression in a neighborhood. This method reduces the noise of the measurements of gene expression and enables the analysis of cell performance, describing the state of the cells at the time of measurement. In this dissertation we improved the original ordering method making deep changes in its algorithm. These changes reduced the program execution time in more than one thousand times. These alterations openned the possibility of ordering the network in any dimension, then we produced a new programm to obtain the network ordering in two dimensions. We analyzed the new results by observing the modules and biological functions distribution. The generalization of the Transcriptogram to two dimensions shows better results than those obtained from the ordering in a list. We also propose a method for selecting samples into two classes and apply it to the diagnosis of Psoriasis. It clearly separated the samples from healthy patients. With the network ordered, we can analyze the regions that show alterations in the Transcriptogram and observe which biological functions are altered, obtaining more information about cell state and enabling the discovery of new targets for drugs.
Databáze: Networked Digital Library of Theses & Dissertations