Development and validation of new methods of distribution of initial population on genetic algorithms for the problem of protein-ligand docking
Autor: | Gonçalves, Reinaldo Bellini |
---|---|
Přispěvatelé: | Barbosa, Helio José Corrêa, Dardenne, Laurent Emmanuel, Borges, Carlos Cristiano H., Caffarena, Ernesto Raúl |
Jazyk: | portugalština |
Rok vydání: | 2008 |
Předmět: |
Desenho racional de fármacos
Matemática aplicada Inteligência artificial - Aplicações biológicas Artificial inteligence CIENCIAS EXATAS E DA TERRA::PROBABILIDADE E ESTATISTICA::PROBABILIDADE::PROCESSOS ESTOCASTICOS ESPECIAIS [CNPQ] Biologia molecular - Processamento eletrônico de dados Genetic algorithms Algoritmos genéticos |
Zdroj: | Biblioteca Digital de Teses e Dissertações do LNCC Laboratório Nacional de Computação Científica (LNCC) instacron:LNCC |
Popis: | Made available in DSpace on 2015-03-04T18:51:00Z (GMT). No. of bitstreams: 1 thesis.pdf: 1380737 bytes, checksum: b13fc1ab9cd11eb3900d2a9edd2a9131 (MD5) Previous issue date: 2008-06-05 Coordenacao de Aperfeicoamento de Pessoal de Nivel Superior The methods of protein-ligand docking are computational methods usedto predict the mode of binding of molecules into drug candidates for its receptor. The docking allows tests of hundreds of compounds in ashort space of time, assisting in the discovery of new drug candidates. The great complexity that involves the binding of protein-ligand complex, makes the problem of docking computationally difficult to be solved. In this work, we used the Genetic Algorithms which is a technique of optimization based on the theory of biological evolution of Darwin. The proposed algorithm was implemented and tested initially by Camila S. de Magalhães in her doctoral thesis, with the Group of Molecular Modeling of Biological Systems at LNCC, with a range of 5 ligands of HIV-1 protease. It was built a new set used for test with 49 structures with several physico-chemical properties, distributed in 22 different families of protein, allowing for a broader test of the algorithm It was conducted a detailed study of the dependence of the genetic algorithm in relation to the distribution of its initial population and it was also investigated ways more efficient and robust to generate the same. Among these, the proposal to distribute the initial population based on the coordinates of individuals of lower energy in the population (proposal 5), it is very promising. This distribution has allowed the algorithm to obtain good results, finding solutions of lower energy in the population very close to experimental structure optimized, without having specific information about the experimental structure. This fact is very important, because the algorithm makes it more realistic in view that in the rational design of drugs, it has not the trial structure. Os métodos de docking proteína-ligante, são métodos computacionais usados para predizer o modo de ligação de moléculas candidatas a fármaco em seu receptor. O docking permite o teste de centenas de compostos em um curto espaço de tempo, auxiliando na descoberta de novos candidatos a fármacos. A grande complexidade que envolve a ligação do complexo ligante-proteína, torna o problema de docking difícil de ser resolvido computacionalmente. Neste trabalho, são usados os Algoritmos Genéticos, que são uma técnica de otimização baseada na teoria da evolução biológica de Darwin. O algoritmo proposto foi implementado e testado inicialmente por Camila S. de Magalhães em sua tese de doutorado, junto ao Grupo de Modelagem Molecular de Sistemas Biológicos do LNCC, com um conjunto de 5 ligantes de HIV-1 protease. Foi construido um novo conjunto utilizado para teste, agora com 49 estruturas com propriedades físico-químicas diversas, distribuidos em 22 famílias distintas de proteínas, permitindo um teste mais amplo do algoritmo. Foi realizado um estudo aprofundado sobre a dependência do Algoritmo Genético em relação à distribuição da sua população inicial e investigou-se formas mais eficientes e robustas de gerar a mesma. Dentre estas, a proposta de distribuir a população inicial baseada nas coordenadas dos indivíduos de menor energia na população (proposta 5), é muito promissora. Esta distribuição permitiu o algoritmo obter bons resultados, encontrando soluções de menor energia na população muito próximas a estrutura experimental otimizada, sem possuir informações específicas sobre a estrutura experimental. Este fato é muito importante, pois torna o algoritmo mais realista, tendo em vista que no desenho racional de fármacos real não se dispoe da estrutura experimental. |
Databáze: | OpenAIRE |
Externí odkaz: |