Modelos multinomiais multivariados aplicados em sequências de DNA

Autor: Cuyabano, Beatriz Castro Dias
Přispěvatelé: Pinheiro, Hildete Prisco, 1966, Lachos Dávila, Víctor Hugo, Nobre, Juvêncio Santos, Universidade Estadual de Campinas. Instituto de Matemática, Estatística e Computação Científica, Programa de Pós-Graduação em Estatística, UNIVERSIDADE ESTADUAL DE CAMPINAS
Rok vydání: 2021
Předmět:
Zdroj: Biblioteca Digital de Teses e Dissertações da Universidade Estadual de Campinas (UNICAMP)
Universidade Estadual de Campinas (UNICAMP)
instacron:UNICAMP
DOI: 10.47749/t/unicamp.2011.788633
Popis: Orientador: Hildete Prisco Pinheiro Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Matemática, Estatística e Computação Científica Resumo: Modelos Multivariados são propostos para descrever a frequência de códons em sequências de DNA, bem como a ordem e frequência em que as bases nitrogenadas se apresentam em cada códon, considerando a dependência entre as bases dentro do códon. Modelos logísticos regressivos são utilizados com diferentes estruturas de dependência entre as posições do códon. Também, modelos baseados em uma extensão da representação de Bahadur para o caso multinomial são propostos para explicar dados multinomiais correlacionados. Uma aplicação desses modelos para o gene NADH4 do genoma mitocondrial humano é apresentada, e comparações desses modelos são feitas a partir de diferentes critérios como AIC, BIC e validação cruzada. Por fim, uma breve análise de diagnósticos é realizada para os modelos logísticos regressivo Abstract: Multivariate models are proposed to describe the codons frequencies in DNA sequences, as well as the order and frequency that nucleotide bases have in each codon, considering the dependence among the bases inside a codon. Logistic regressive models are used with different structures of dependence among the three positions in a codon. Also, models based on a multinomial extension of the Bahadur's representation are proposed to explain correlated multinomial data. An application of these models to the NADH4 gene from human mitochondrial genome is presented, and model comparisons among them are done by different criteria such as AIC, BIC and cross validation. At last, a brief diagnostic analysis is done upon the logistic regressive models Mestrado Estatística Mestre em Estatística
Databáze: OpenAIRE