Generalized additive main effect and multiplicative interaction (GAMMI) model for data imputations in multi-environmental experiments
Autor: | Pedro Marinho Amoêdo |
---|---|
Přispěvatelé: | Sonia Maria de Stefano Piedade, Lúcio Borges de Araújo, Edilan de Sant'Ana Quaresma |
Jazyk: | portugalština |
Rok vydání: | 2020 |
Zdroj: | Biblioteca Digital de Teses e Dissertações da USP Universidade de São Paulo (USP) instacron:USP |
Popis: | As análises mediante abordagem de modelo de efeitos principais aditivos e interação multiplicativa exigem que as matrizes de dados, provenientes de experimentos multiambientais, sejam completas, o que em geral não ocorre. Uma excelente alternativa para contornar o problema das ausências para posterior análise são os métodos de imputação de dados. Esta tese tem por objetivo desenvolver duas estratégias de imputação de dados para experimentos multiambientais por meio de modelos GAMMI. Um algoritmo de imputação simples e outro de imputação múltipla. O algoritmo de imputação simples foi desenvolvido a partir da combinação do método de imputação EM-AMMI com o modelo de efeitos principais aditivos e interação multiplicativa generalizado (GAMMI). O segundo algoritmo, de imputação múltipla, é uma extensão do algoritmo EM-AMMI generalizado (EM-GAMMI), desenvolvido a partir da proposta de imputação com uso dos resíduos simples do modelo de regressão linear. Para determinar o desempenho dos algoritmos de imputação, foram realizadas simulações de retiradas aleatória de valores em diferentes porcentagens em que foram tomados dois conjuntos de dados reais completos como base. Os dois conjuntos possuem dimensões, um 4×5 e o outro de dimensão 19×6. Então, a qualidade das imputações foi avaliada por meio das distribuições da estatística raiz normalizada do erro quadrático médio (NRMSE) e da estatística geral de acurácia (Tacc), obtidas a partir dos valores imputados em cada um dos níveis de retiradas. Concluiu-se que os novos métodos constituem ferramentas eficientes como técnicas de imputação de dados, útil para contornar o problema das ausências em experimento multiambientais. Analyzes using a model of main additive effects and multiplicative interaction require that the data matrices, coming from multi-environmental experiments, be complete, which in general does not occur. An excellent alternative to circumvent the problem of absences for further analysis are the methods of data imputation. This thesis aims to develop two data imputation strategies for multi-environmental experiments using GAMMI models. A simple imputation algorithm and a multiple imputation algorithm. The simple imputation algorithm was developed from the combination of the EM-AMMI imputation method with the main additive effects and generalized multiplicative interaction (GAMMI). The second algorithm, of multiple imputation, is an extension of the generalized EM-AMMI algorithm (EM-GAMMI), developed from the imputation proposal using simple residues of the linear regression model. To determine the performance of the imputation algorithms, simulations were carried out with random remove values with different percentages in which two real data sets were taken as a reference. The two sets had dimensions, one 4 x 5 and the other 19 x 6. Then, the quality of the imputations were assessed through the distribution of the normalized root statistic of the mean square error (NRMSE) and the statistic overall accuracy statistic (Tacc), obtained from the imputed values in each of the levels of simulated withdrawals. It was concluded that the new methods are efficient tools such as data imputation techniques, being useful to circumvent the problems of missing samples in a multi-environmental experiment. |
Databáze: | OpenAIRE |
Externí odkaz: |