Genotipagem de poliplóides: um modelo de urnas e bolas
Autor: | Silvio Rodrigues de Faria Junior |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2012 |
Předmět: | |
Zdroj: | Biblioteca Digital de Teses e Dissertações da USPUniversidade de São PauloUSP. |
Druh dokumentu: | Doctoral Thesis |
Popis: | Desde os primórdios da agricultura e pecuária, o homem seleciona indivíduos com características desejáveis para reprodução e aumento da proporção de novos indivíduos com tais qualidades. Com o conhecimento da estrutura de DNA e o advento da engenharia genética, a identificação e caracterização de espécies e indivíduos conta com novas tecnologias para auxiliar no desenvolvimento de novas variedades de plantas e animais para diversos fins. Tais tecnologias envolvem procedimentos bioquímicos e físicos cada vez mais apurados que produzem medidas cada vez mais precisas, um exemplo disso são as técnicas que empregam a espectometria de massa para comparar polimorfismos de base única (SNPs). Nas plantas é comum a ocorrência de poliploidia, que consiste na presença de mais de dois cromossomos num mesmo grupo de homologia. A determinação do nível de ploidia é fundamental para a correta genotipagem e por consequência maior eficiência no estudo e aprimoramento genético de plantas. Neste trabalho caracterizamos o fenômeno da poliploidia com modelos probabilísticos de urnas e bolas, propondo um método eficiente e adequado de simulação, assim como uma técnica simples para inferir níveis de ploidia e classificar amostras bialélicas aproveitando características geométricas do problema. Análises de dados simulados e reais provenientes de um experimento de cana-de-açúcar foram realizadas com diferentes medidas de separação entre agrupamentos e diferentes condições experimentais. Para os dados reais, métodos gráficos descritivos evidenciam a corretude e coerência do método proposto, que pode ser generalizado para a genotipagem de locos multialélicos poliplóides. Encerramos o trabalho comparando nossos resultados com a abordagem SuperMASSA [Serang2012] que trouxe excelentes resultados ao problema. Todo código desenvolvido em linguagem R está disponibilizado com o texto. Since the beginnings of agriculture and livestock, the man selects individuals with desirable characteristics to breed and increase the proportion of new individuals with such qualities. With knowledge of the DNA structure and the advent of genetic engineering, the identification and characterization of individual species can make use of new technologies to help develop new varieties of plants and animals for many purposes. These technologies involve complex biochemical and physical procedures that produce even more accurated measures, like techniques that employ mass spectrometry to compare single nucleotide polymorphisms (SNPs). In plants it is common the occurrence of polyploidy, which is the presence of more than two chromosomes in the same group of homology. The determination of polyploidy level is essential for correct SNPs genotype calling and therefore greater efficiency in the study and genetic improvement of plants. In this work we characterize the phenomenon of poliploidy with probabilistic urns and balls models, proposing an efficient and appropriate method of simulation, as well as a simple technique to infer ploydy levels and classify biallelic samples accurately taking advantage of geometrical characteristics of the problem. Analysis of simulated and real data from an experiment of sugarcane were conducted with different measures of separation between groups and different experimental conditions. For the actual data, descriptive graphical methods show the correctness and consistency of the proposed method, which can be generalized to multi-allelic loci genotyping polyploid. We end our work comparing our results with the SuperMASSA [Serang2012] approach that brought excellent results to the problem. All code developed in language R were provided with the text. |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |