Avaliação da utilização de índices de similaridade genômica global para classificação de espécies patogênicas emergentes do gênero Corynebacterium
Autor: | Alves, Daniele Almeida |
---|---|
Přispěvatelé: | Pacheco, Luis Gustavo Carvalho, Aguiar, Eric Roberto Guimarães Rocha, Castro, Thiago Luiz de Paula, Neto, Aristóteles Góes |
Jazyk: | portugalština |
Rok vydání: | 2020 |
Předmět: | |
Zdroj: | Repositório Institucional da UFBA Universidade Federal da Bahia (UFBA) instacron:UFBA |
Popis: | Submitted by DANIELE ALVES (daniele.aalves@hotmail.com) on 2021-03-22T18:08:30Z No. of bitstreams: 1 03_11_Dissertacao_Daniele_Almeida_Alves.pdf: 3978391 bytes, checksum: 8c317d187b25fb0b6afff2a693c66002 (MD5) Approved for entry into archive by Delba Rosa (delba@ufba.br) on 2021-03-23T17:47:22Z (GMT) No. of bitstreams: 1 03_11_Dissertacao_Daniele_Almeida_Alves.pdf: 3978391 bytes, checksum: 8c317d187b25fb0b6afff2a693c66002 (MD5) Made available in DSpace on 2021-03-23T17:47:22Z (GMT). No. of bitstreams: 1 03_11_Dissertacao_Daniele_Almeida_Alves.pdf: 3978391 bytes, checksum: 8c317d187b25fb0b6afff2a693c66002 (MD5) Coordenação de Aperfeiçoamento de Pessoal de Nível Superior - CAPES Índices de Similaridade Genômica Global têm sido amplamente utilizados nos últimos anos para classificação taxonômica de bactérias. Entre estes, a Identidade Média de Nucleotídeos por BLAST (ANIb) é amplamente considerada como o índice mais preciso para a circunscrição de espécies bacterianas, quando se considera um limite 95-96% de identidade. No entanto, o uso exclusivo de ANIb para esta identificação pode gerar resultados confusos para alguns grupos bacterianos intimamente relacionados, como muitos patógenos de Corynebacterium spp. Nesse trabalho desenvolvemos e avaliamos o desempenho de um classificador de espécies desenvolvido internamente, com base nos valores de correlação entre diferentes índices de parentesco do genoma, para classificar sequências genômicas do grupo Corynebacterium diphtheriae. Para isso, 213 sequências genômicas correspondentes a três espécies de Corynebacterium intimamente relacionadas foram recuperadas do NCBI Genoma DB: 188 classificados como C. diphtheriae e 03 isolados de C. diphtheriae subsp. lausannense; 10 como Corynebacterium belfantii; 01 como Corynebacterium rouxii e 11 classificados como C. diphtheriae obtidos do Arquivo Europeu de Nucleotídeos. Os padrões de uso de tetranucleotídeos (TETRA) e ANIb foram calculados no servidor Web JSpecies através de comparações par-a-par entre os genomas avaliados. As matrizes resultantes foram mescladas para gerar uma matriz com os valores concatenados de ANIb e TETRA para cada bactéria, representando uma forma de impressão digital, que foi então utilizada para calcular os valores de correlação de Spearman entre os genomas através de uma estratégia própria desenvolvido no ambiente estatístico R. Análise de sequência multilocus utilizando os genes: atpA, gyrA, dnaE, dnaK, fusA, leuA e rpoB e análises de decomposição dividida foram usados para confirmar as relações entre as várias espécies. No total, 45.369 comparações genoma a genoma compuseram a matriz de impressão digital das bactérias que foi usada para construir um dendrograma com clados bem definidos (> 95% de confiança de bootstrap). Os grupos contendo C. belfantii e C. rouxii foi claramente distinguido por esta estratégia, em oposição ao uso de ANIb sozinho que não foi capaz de diferenciar as espécies C. diphtheriae subsp. lausannense CHUV2995 e C. belfantii. Adicionalmente, observamos que nossos resultados são corroborados pela MLSA, evidenciando a classificação errada no NCBI. Com os resultados supracitados nós concluímos que o classificador desenvolvido internamente que integra diferentes índices foi a ferramenta mais eficiente para a circunscrição de espécies no grupo C. diphtheriae, quando comparada para ANIb sozinho. Antecipamos que esta nova estratégia pode ser extrapolada para melhorar a identificação baseada no genoma de outros patógenos bacterianos clinicamente importantes. Overall genome-relatedness indexes (OGRIs) have been extensively used in recent years for taxonomic classification of bacteria. Among these, Average Nucleotide Identity by BLAST (ANIb) is widely regarded as the most accurate index for bacterial species circumscription, when considering a species boundary of ca. 95-96% identity. However, the sole use of ANIb for species identification may render confusing results for some closely related bacterial groups, such as many pathogenic Corynebacterium spp. In this work we develop and evaluate performance of an in-house developed species-classifier, based on the correlation values between different genome relatedness indexes, to correctly classify genomic sequences from the Corynebacterium diphtheriae group. For that, 213 genomic sequences corresponding to three closely related Corynebacterium species were retrieved from NCBI’s Genome DB: 188 classified in NCBI Taxonomy as Corynebacterium diphtheriae, including the reference strain NCTC11397 and 03 isolates of C. diphtheriae subsp. Lausannense; 10 as Corynebacterium belfantii; 01 as Corynebacterium rouxii and 11 classified as C. diphtheriae obtained from the European Nucleotide Archive. Tetranucleotide usage patterns (TETRA) and average nucleotide identities by BLAST (ANIb) were calculated through the JSpecies Web server application and compared all-vs-all. Resulting matrices were then merged to generate a single fingerprint matrix, which was used to calculate the Spearman’s correlation values among bacterial genomes using an in-house script developed on R software. MLSA (genes: atpA, gyrA, dnaE, dnaK, fusA, leuA e rpoB) and split-decomposition analyses were used to confirm relationships between the various species. In total, 45,369 genome-to-genome comparisons composed the fingerprint matrix that was used to build a dendogram with well-defined clades (> 95% boostrap confidence). The groups containing C. belfantii and C. rouxii were clearly distinguished by this strategy, as opposed to the use of ANIb alone that was unable to differentiate the C. diphtheriae subsp. lausannense strain CHUV2995 and C. belfantii. Additionally, we observed that our results are corroborated by the MLSA, highlighting the wrong classification in the NCBI. With the aforementioned results we concluded that the classifier developed internally that integrates different OGRIs was the most efficient tool for the circumscription of species in the group C. diphtheriae, when compared to ANIb alone. We anticipate that this new strategy can be extrapolated to improve the genome based on identification of other clinically important bacterial pathogens. |
Databáze: | OpenAIRE |
Externí odkaz: |