Teoria da Informação Aplicada ao estudo de interações proteína-proteína

Autor: Andrade, Miguel de Souza
Přispěvatelé: Treptow, Werner L.
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: Repositório Institucional da UnB
Universidade de Brasília (UnB)
instacron:UNB
Popis: Tese (doutorado)—Universidade de Brasília, Instituto de Ciências Biológicas, Departamento de Biologia Celular, Programa de Pós-Graduação em Biologia Molecular, 2020. Interações proteína-proteína (PPI) são processos-chave para a manutenção da vida. As proteínas sofrem diversas pressões seletivas para serem funcionais o que inclui pressões para a manutenção das interações. Nesse contexto, observamos a coevolução de pares de proteínas, que é quando a evolução de uma delas afeta a evolução da outra e vice versa. A Coevolução pode ser quantificada por medidas de correlação entre as substituições de aminoácidos, como por exemplo a transinformação (I). Essas medidas podem ser utilizadas para resolver diferentes problemas biológicos no contexto de PPI, a saber: (i) predição de contatos tridimensionais, (ii) predição de interfaces de interação, (iii) predição de redes de interação e (iv) proposição de pareamento de sequências homólogas de proteínas que interagem. É sabido que diversas fontes contribuem para os valores de I, entretanto entender como cada uma dessas fontes contribui para a resolução desses problemas permanece um desafio. Nesse sentido, esta Tese de Doutorado tem como objetivo entender como a evolução, a coevolução e a estocasticidade influenciam nos valores I e mais do que isso, compreender qual a usabilidade dessas diferentes fontes na resolução do problema (iv). Utilizando alinhamentos de sequências e estruturas disponíveis em bancos de dados, eu mostro aqui que a quantidade de I resultado da coevolução pode ser a mais interessante para a resolução do problema (iv). Isso porque a essa quantidade é a que possui menor degeneração, isto é, nos permite distinguir melhor entre arranjos de pareamento que fazem sentido biológico de arranjos aleatórios e deve ser a única fonte em sistemas que coevoluem em organismos diferentes. Além disso essa fonte de informação coevolutiva pode ser captada apenas em interfaces de interação corretas e de curta distância. Por fim, apresento perspectivas em otimizações para resolução de problemas do tipo (IV). Protein-protein interactions (PPI) are a key process for maintenance of life. Proteins are under diverse selective pressures to maintain their function and interactions. I this context, we observe the coevolution of protein pairs, which is when the evolution of one affect the evolution of other and vice-versa. The coevolution can be quantified by correlation metrics between the amino acids substitution, like mutual information (I). These metrics can be used to solve different biological problems like: (i) structural contacts prediction, (ii) interaction interface prediction, (iii) network interaction prediction and (iv) interactinng proteins homologous pairing. It has been known that different sources contributes to I values, however, to understand how each one of these sources contributes for these problems remains a challenge. In this way, this PhD thesis has as goal understand how the evolution, the coevolution and the stochastic influences I values and more than that, understand the usability of this different sources to solve problem (iv). Using multiple sequence alignments and structures available in data bases, I show here that the I resulted of coevolution can be the best choice to solve the problem (iv). Because, these quantity has less degeneration than others, that is, I resulted from coevolution allow us to distinguish better biological pairing from random pairing and must be the unique source in systems who evolved in different organisms. Furthermore, this source of coevolutive information could be found just in correct interfaces defined by short distances. finaly, I show perspectives in maximization to solve the problem (iv).
Databáze: OpenAIRE