Predição da agregação de proteínas utilizando aprendizagem de máquina
Autor: | Moreira, Carlos Alves |
---|---|
Přispěvatelé: | Scott, Ana Lígia Barbour, Philot, Eric Allison, Braz, Antônio Sérgio Kimus, Magro, Angelo José |
Jazyk: | portugalština |
Rok vydání: | 2018 |
Předmět: | |
Zdroj: | Repositório Institucional da UFABC Universidade Federal do ABC (UFABC) instacron:UFABC |
Popis: | Orientadora: Profa. Dra. Ana Ligia Scott Coorientador: Prof. Dr. Eric Allison Philot Dissertação (mestrado) - Universidade Federal do ABC, Programa de Pós-Graduação em Engenharia da Informação, Santo André, 2018. A expectativa de vida média da população mundial vem crescendo gradualmente, acompanhada de doenças neurodegenerativas como: Parkinson, Alzheimer, Esclerose Lateral Amiotrófica, Diabetes Tipo II, doença de Huntington e Atrofia Muscular Espinhal. Atualmente, gastam-se bilhões de dólares com o tratamento dessas doenças, o que destaca a importância e a necessidade de investir esforços no estudo e entendimento dos mecanismos moleculares envolvidos. Apesar de um número significativo de pesquisas conduzidas, essas patologias e os mecanismos moleculares envolvidos não estão completamente compreendidos até esse momento. Essas doenças degenerativas geralmente envolvem algum tipo de processo de agregação de proteínas, que são macromoléculas envolvidas no processo biológico e cuja função depende de sua estrutura tridimensional (3D) ou conformação nativa. O estudo dos mecanismos moleculares que levam à agregação pode ajudar no desenvolvimento de medicamentos e terapias. Existem diversos trabalhos que investigam a possibilidade de predição de regiões propensas à agregação na proteína. Alguns desses trabalhos fazem uso de métodos computacionais baseando-se em dados experimentais. O uso de técnicas de Aprendizagem de Máquina (AM) vem sendo utilizado com bastante êxito na área de bioinformática na busca de padrões, classificações e predições de dados. Esse trabalho de mestrado teve como objetivo principal, o desenvolvimento de uma ferramenta de predição de regiões da proteína propensas à agregação, baseando-se na sequência primária da proteína e utilizando técnicas de Aprendizagem de Máquina. No decorrer do projeto foram estudados os processos envolvidos com o folding proteico, o fenômeno da agregação de proteínas, algumas características físico-químicas, alguns métodos de predição de propensão de agregação de proteínas, algumas bases de dados de proteínas disponíveis, bem como algoritmos e ferramentas de Aprendizagem de Máquina (AM). Com base nesses estudos foi desenvolvido então o aplicativo MAGRE, como o objetivo de efetuar a predição de regiões propensas à agregação da proteína utilizando técnicas de Aprendizagem de Máquina. Os resultados obtidos foram comparados com alguns preditores encontrados na literatura como o Aggrescan e o Zyggregator e demonstraram índices de acertos relevantes na predição de regiões propensas a agregação de proteínas. The average life expectancy of the world population has been growing gradually followed by neurodegenerative diseases such as: Parkinson's, Alzheimer's, Amyotrophic Lateral Sclerosis, Type II Diabetes, Huntington's Disease and Spinal Muscular Atrophy. Currently, billions of dollars are spent on the treatment of these diseases, which highlights the importance and necessity of investing efforts in the study and understanding of the molecular mechanisms involved. Despite a significant number of studies conducted, these pathologies and the molecular mechanisms involved are not fully understood until now. These degenerative diseases usually involve some sort of process of aggregation of proteins, which are macromolecules involved in the biological process and whose function depends on its threedimensional (3D) structure or native conformation. The study of the molecular mechanisms that lead to aggregation can help in the development of drugs and therapies. There are several studies that investigate the possibility of prediction of regions prone to aggregation in the protein. Some of these works make use of computational methods based on experimental data. The use of Machine Learning (AM) techniques has been used with great success in the area of bioinformatics in the search of standards, classifications and predictions of data. This master's work had as main objective, the development of a tool to predict regions of the protein prone to aggregation, based on the primary sequence of the protein and using Machine Learning techniques. During the course of the project, we studied the processes involved in protein folding, the phenomena of protein aggregation, some physicochemical characteristics, some protein aggregation propensity prediction methods, some available protein databases, as well as algorithms and Machine Learning (AM) tools. Based on these studies, the MAGRE application was developed as the objective of predicting regions prone to protein aggregation using Machine Learning techniques. The results obtained were compared with some predictors found in the literature such as Aggrescan and Zyggregator and demonstrated indexes of relevant hits in the prediction of regions prone to protein aggregation. |
Databáze: | OpenAIRE |
Externí odkaz: |