Analysis of similarity between the sequences of genes of HIV-1 and Human Genome

Autor: Galinskas, Juliana [UNIFESP]
Přispěvatelé: Universidade Federal de São Paulo (UNIFESP), Janini, Luiz Mário Ramos [UNIFESP]
Jazyk: portugalština
Rok vydání: 2010
Předmět:
Zdroj: Repositório Institucional da UNIFESP
Universidade Federal de São Paulo (UNIFESP)
instacron:UNIFESP
Popis: Os genes virais podem ter origens celulares ou não. Eles podem ter sido reunidos durante a evolução, sendo que cada um pode corresponder a uma origem distinta. A similaridade entre sequências genéticas sugerem homologia e, portanto, um parentesco evolutivo. O presente estudo tem como objetivo identificar regiões de similaridade, com suporte estatístico confiável, entre o genoma do HIV-1 e o genoma humano a partir da análise comparativa entre sequências de DNA, por meio do programa BLAST. Também é de nosso interesse desenvolver uma metodologia que permita comparar sequências genéticas de diversos organismos, de forma que a similaridade possa ser quantificada. Para realizar as comparações entre as sequências genéticas, é utilizada a ferramenta BLASTn (versão 2.2.20) e um banco de dados local composto pelos cromossomos humanos. Python (versão 5.1.30) é utilizada para o processamento das sequências, e a análise dos dados é feita utilizando a linguagem estruturada de consulta SQL (Structured Query Language). O genoma humano é comparado com: sequências dos genes do HIV-1, sequências de genes do vírus do mosaico do tabaco (controle negativo biológico), trechos de cromossomos da Macaca mulatta (controle positivo biológico) e sequências aleatórias (controle negativo não biológico). O presente estudo demonstra diferenças entre os genes do HIV-1 e a região LTR. Alguns genes demonstram maior similaridade com o genoma humano do que outros, de acordo com a análise da curva do fitting. Ao verificar a curva obtida a partir de E-values muito baixos, observa-se que todos os genes do HIV-1 apresentam curva não linear do tipo y = a0 . xa1, onde a0 e a1 são parâmetros obtidos a partir de ajuste numérico. O método é validado utilizando dados do genoma da Macaca mulatta, pelo qual é observada alta similaridade com o genoma humano. A partir desta validação é possível construir três diferentes grupos de genes do HIV-1 de acordo com o valor de a1, onde: os genes env, gag, nef, pol, rev, tat e vif apresentam valores de a1 idênticos, o gene vpr um valor mais baixo e o gene vpu um valor bem mais alto. It is possible that viral genes have cellular origins. They may have been gathered during evolution, and each one may correspond to a distinct origin. The similarity between genetic sequences suggest homology and, therefore, an evolutive relationship. The present study aimed at identifying region with similarity, with significant statistic support, between the human and the HIV-1 genome through the comparative analysis between DNA sequences using the BLAST program. It is also our purpose to develop a methodology which allows the comparison between genetic sequences of diverse organisms, quantifying the similarity. Thus, to carry it through, we use the BLASTn software (2.2.20 version) and a local database of human chromosomes. Python (5.1.30 version) is used for sequence processing and the data analysis is made using the SQL (Structured Query Language). The human genome is compared to sequences from: HIV-1 genes, Tobbaco Mosaic Virus genes (negative non-biologic control), chromosomes motifs of Macaca mulatta (positive biologic control) and random sequences (negative non-biologic control). We find differences between all the HIV-1 genes and the LTR region. Some genes show more similarity with the human genome than others, according to the curve fitting analysis. When analyzing the curve obtained at very low E-values, it is observed that all HIV-1 genes are well represented by a non-linear curve fitting y = a0 . xa1 where a0 and a1 are parameters obtained numerically. As a result, the method is validated using the data from the genome of Macaca mulatta for which a high level of similarity with the human genome is observed. Based on this validation, it is possible to form three distinct groups of genes from HIV-1 according to the a1 value where: the env, gag, nef, pol, rev, tat and vif genes have identical a1 values; the vpr gene a very low a1 value; and the vpu a a1 higher value. TEDE BV UNIFESP: Teses e dissertações
Databáze: OpenAIRE