Novas percepções em modelagem genética de característica de crescimento e reprodutiva em bovinos cruzados tropicais e Nel,ore
Autor: | Santana, Talita Estéfani Zunino |
---|---|
Přispěvatelé: | Silva, Luiz Otávio Campos da, Menezes, Gilberto Romeiro de Oliveira, Chizzotti, Mário Luiz, Silva, Fabyano Fonseca e |
Jazyk: | angličtina |
Rok vydání: | 2019 |
Předmět: | |
Zdroj: | LOCUS Repositório Institucional da UFV Universidade Federal de Viçosa (UFV) instacron:UFV |
Popis: | Conselho Nacional de Desenvolvimento Científico e Tecnológico Nas avaliações genéticas de animais de produção modelos lineares infinitesimais são frequentemente assumidos, os quais não consideram efeitos de origem não-aditiva e não-linear o que pode reduzir a capacidade preditiva, principalmente em populações de animais cruzados. Neste contexto, há um crescente interesse em métodos de predição que permitem acesso a esses efeitos, sobretudo, sem assumir pressupostos estatísticos. Para predizer valores genéticos em populações cruzadas, o ponto-chave é utilizar métodos que permitem avaliar efeitos não-aditivos (heterose, complementaridade e perdas epistáticas). No entanto, esses efeitos são altamente correlacionados (o que implica em uma condição estatística desfavorável) e frequentemente assumidos como igualmente relevantes. Neste sentido, implementou-se um modelo de seleção de variáveis (BayesB) para estimar efeitos não-aditivos, bem como obter valores genéticos para peso à desmama em uma população com 16.126 bovinos de corte correspondentes a vinte e seis composições de cruzas. O BayesB provou ser um método poderoso para reduzir os problemas de estimativa provenientes de covariáveis não-aditivas, e efeitos comumente assumidos como importantes (efeitos genéticos não-aditivos maternos e ambos efeitos aditivos da raça não são relevantes) foram estatisticamente irrelevantes, o que contrapõe as predefinições empíricas assumidas em vários estudos. Além dos benefícios estatísticos promovidos pela redução de dimensionalidade, o modelo BayesB pode reduzir a demanda computacional e o tempo de processamento por permitir estimar efeitos não-aditivos e predizer valores genéticos em uma única etapa, ou seja, sem analises adicionais como é atualmente realizado. Isto torna o modelo BayesB muito atrativo para aplicação em programas de melhoramento genético de bovinos de corte cruzados. Por outro lado, no campo da seleção genômica ampla, novos métodos estatísticos vêm sendo propostos para minimizar os efeitos colaterais (alta dimensionalidade e multicolinearidade) advindos da estimativa simultânea de SNPs. No entanto, os estudos aplicados à classificação genômica com aprendizado de máquina são poucos. Neste sentido, os métodos de redes neurais artificiais (RNA) têm tido grande visibilidade, no entanto, cenários com maiores conjuntos de dados genômicos analisados por algoritmos de aprendizado de máquina (ML), como RNA, implicam em um dispendioso processamento computacional. Por esta razão, buscando algoritmos ML mais simples para análise de dados genômicos, foram utilizados os métodos AdaBoost - ADA, Bernoulli Naïve Bayes - NB, Decision Tree - DT, Nearest Neighbors - KN, Multilayer Perceptron MLP, e Support Vector Machine para Classification (SVC) para a classificação genômica de stayability em bovinos Nelore. Neste estudo foi realizada seleção de SNPs para ajustar diferentes conjuntos dados genômicos proveniente dos touros (mil, três mil e cinco mil marcadores), a fim de avaliar o impacto da estrutura de dados na classificação das filhas. Além disso, foi incluído ruído biológico nos fenótipos a fim de desafiar os algoritmos de aprendizado. Nesse sentido, verificou-se que os métodos de ML mais simples, como Naïve Bayes, são superiores à métodos mais elaborados para resolver questões complexas de classificação. In genetic evaluations of farm animals, infinitesimal linear models are frequently assumed, which do not consider source of non-additive and non- linear effects, it might reduce the predictive ability, mainly in populations of crossbred animals. In this context, there have been increasing interest in prediction methods that allow access these effects, above all, without assume statistical presuppositions. For predict breeding values in crossbred populations the key point use methods that allow assess non-additive effects (heterosis, complementarity and epistatic losses). However, these effects are highly correlated and frequently assumed as equally relevant. In the sense, a variable selection model (BayesB) was implemented to estimate non-additive effects as well as obtain breeding values for weaning weight in a population with 16,126 beef cattle corresponding to twenty-six crosses compositions. The BayesB proved to be a powerful method to reduce the estimation problems coming from non-additives covariates, and effects frequently assumed as important (maternal non-additive genetic effects and both breed additive effects are not relevant) were statistical reset, opposing the empirical presets assumed in several studies. In addition to benefits statistical promoted by dimensionality reduction, the BayesB model might reduce computational demand and processing time given that enable estimate non-additive effects and predict breeding values in single step, in other words, without additional analysis as it is currently done. It makes the BayesB model very attractive for application in breeding programs of crossbred beef cattle. On the other hand, in the genome-wide selection field, new statistical methods have been proposed in order to minimize the side effects (high-dimensionality and multicollinearity) coming from simultaneous estimation of SNPs. However, the studies applied to genomic classification with machine learning are few. In the sense, the artificial neural network (ANN) methods have been highlighted, however, scenarios with larger genomic data set analyzed by machine learning (ML) algorithms, as ANN, imply in an expensive computational processing. For this reason, searching ML algorithms simplest, was proposed a study of genome-enabled classification by several machine learning frameworks for stayability trait in Nellore cattle. In this study, was performed SNPs selection a set (one, three and five thousand markers), in order to evaluate the impact of structure data set in the classification of daughters. Moreover, was included biological noise in phenotypes in other to challenge to learning algorithms. In this sense, was verify that ML frameworks simplest, as Naïve Bayes, are better to elaborate methods to solve complex issue of classification. |
Databáze: | OpenAIRE |
Externí odkaz: |