Construção da matriz de covariância gamética para análises de QTL em populações exogâmicas

Autor: Pita, Fabiano Veraldo da Costa
Přispěvatelé: Euclydes, Ricardo Frederico, Guimarães, Simone Elisa Facioni, Lopes, Paulo Sávio
Jazyk: angličtina
Rok vydání: 2003
Předmět:
Zdroj: LOCUS Repositório Institucional da UFV
Universidade Federal de Viçosa (UFV)
instacron:UFV
Popis: Conselho Nacional de Desenvolvimento Científico e Tecnológico A aplicação de análises de “Quantitative Trait Loci” (QTL) em populações exogâmicas é desafiadora porque pressuposições simplificadoras não podem ser aplicadas (por exemplo, os alelos QTL não podem ser assumidos fixados em diferentes famílias, o número de alelos QTL segregantes não é conhecido a priori, não há desequilíbrio de ligação entre um dado alelo marcador e um dado alelo QTL). Quando o efeito genotípico do QTL é assumido aleatório no modelo de análise, a matriz de covariância gamética deve ser calculada para a realização das análises em populações exogâmicas. A acurácia dessa matriz é importante para a obtenção de estimativas confiáveis da posição ou efeito do QTL em análises de mapeamento, ou de valores genotípicos em avaliação genética assistida por marcadores. O objetivo do primeiro estudo foi avaliar diferente estratégias já implementadas em programas computacionais (SO- LAR, LOKI, ESIP e MATVEC) para calcular a matriz de coeficientes Idênticos por Descendência (IBD), que é necessária para o mapeamento de QTL em populações exogâmicas. SOLAR utiliza um método baseado em regressão linear, LOKI e ESIP são ambos baseados em “reverse peeling” e o amostrador implementado em MAT VEC amostra indicadores de segregação. Um pedigree com estrutura F2 típica foi simulado com uma família F2 pequena (2 indivíduos) ou grande (20 indivíduos) e marcadores flanqueadores localizados a 2 cM, 5 cM ou 10 cM de distância um do outro, com o QTL localizado no meio do intervalo. A habilidade dessas estratégias em lidar com informações de marcadores perdidas foi avaliada assumindo um dos pais da geração F2 com ou sem informação de marcador. SOLAR nao estimou os coeficientes IBD corretamente para a maior parte das situações simuladas, enquanto que LOKI apre- sentou problemas quando o tamanho da família F2 era grande. ESIP e o amostrador em MATVEC apresentaram bom desempenho em todas as situacões simuladas, com estimativas de coeficientes IBD próximas aos coeficientes verdadeiros. Portanto, ESIP e MATVEC são os softwares mais indicados quando analises genéticas são realizadas em pedigrees com estruturas complexas. O objetivo do segundo estudo foi avaliar o efeito da utilização de uma melhor aproximação da inversa da matriz de covariância gamética para a avaliação genética de grandes populações de animais domésticos. Algoritmos eficientes, baseados no rastreamento dos alelos QTL de um indivíduo em relação aos de seus avós (Probabilidade de Descendência de um QTL - PDQ), podem ser usados para construir a inversa da matriz de covariância gamética diretamente. Mas essa inversa é uma aproximação quando há informação incompleta de marcador. Também, o calculo exato de PDQºs torna-se difícil quando a informação de marcador é incompleta. Nesse estudo, a inversa da matriz de covariãncia gamética para uma pop- ulação exogãmica simulada foi calculada usando o algoritmo eficiente, mas as PDQ's foram calculadas usando um algoritmo Monte Carlo Cadeia de Markov (MCMC). Essa inversa foi utilizada para predizer o valor genético dos indivíduos através de BLUP assistido por marcadores (MABLUP). O efeito dos cálculos de PDQ usando o algoritmo MCMC sobre a acurãcia da MABLUP foi avaliado com base na resposta a seleção realizada, calculada para o pedigree simulado. Os resultados mostraram que quando as PDQ’S foram estimadas usando MCMC a perda em resposta devido ao uso da inversa aproximada pode ser reduzida em aproximadamente 20%, enquanto que em estudos anteriores essa redução foi de 50%. Ainda, quando quatro marcadores bi-alélicos foram utilizados a resposta para MABLUP foi maior e a perda em re- sposta devido a marcadores com informação perdida foi menor, quando comparadas a situação onde apenas dois marcadores bi-alélicos foram utilizados. The application of Quantitative Trait Loci (QTL) analyses in outbred population is challenging because simplified assumptions do not hold for these populations (e.g., the QTL alleles cannot be assumed fixed in different families, the number of QTL alleles segregating is not known a priori, there is not gametic phase disequilibrium between a given genetic marker allele and a QTL allele). When the QTL genotypic effect is assumed random, the gametic covariance matrix must be calculated to per- form QTL analyses in outbred populations. The accuracy of this matrix is important to obtain reliable estimates of QTL position or effect when applying QTL mapping, or QTL genotypic values when applying Marker Assisted Genetic Evaluation. The objective of the first study was to evaluate the different strategies already imple- mented in softwares (SOLAR, LOKI, ESIP and MATVEC) to calculate the matrix of identical by descent (IBD) coefficients, which is required for QTL mapping anal- ysis in outbred populations. SOLAR uses a regression method, LOKI and ESIP are both based on reverse peeling, and the MAT VEC sampler samples segregation in- dicators. A typical F2 pedigree was simulated with a small (2 offspring) or a large (20 offspring) F2 family, and the flanking markers were simulated 2 CM, 5 CM, or 10 CM apart, with the QTL located in the middle. The ability of these strategies to deal with missing genetic marker information was evaluated assuming one of the F2 parents with or without marker information. SOLAR failed to estimate the correct coefficients at almost all situations simulated, while LOKI showed problems when a large family was present in the pedigree. ESIP and MATVEC sampler performed well at all situations, providing IBD coefficients closed to the true ones. Therefore, ESIP and MATVEC are more indicated when genetic analysis are carried out on complex pedigree structures. The objective of the second study was to evaluate the effect of using a better approximation of the inverse of the gametic covariance matrix on the genetic evaluation of large livestock populations. Efficient algorithms, based on trac- ing the QTL alleles of an individual to its grandmother or grandfather (probability of descent a QTL - PDQ’s), can be used to construct the inverse of the gametic covari- ance matrix directly. But this inverse is an approximation when incomplete marker information is available. Also, computing the exact PDQ’s becomes difficult when marker information is incomplete. In this study, the inverse of the gametic covariance matrix for a simulated outbred pedigree was calculated using the efficient algorithm, but the PDQ’s were calculated using a Markov chain Monte Carlo (MCMC) algo- rithm. This inverse was used to calculate the predicted genetic value of individuals through Marker Assisted Best Linear Unbiased Prediction (MABLUP). The effect of PDQ calculations using the MCMC algorithm on MABLUP accuracy was evaluated based on the realized response to selection for the simulated pedigree. The results showed that by estimating the PDQ’s by MCMC the loss in response because of using an approximate inverse could be reduced to about 20%, while in previous studies this reduction was of 50%. Further, response to MABLUP was greater when four bi-allelic markers were used, and the loss in response due to missing markers was smaller in the case with four markers compared to when only two bi-allelic markers were used.
Databáze: OpenAIRE