Aprendizagem de máquina para classificação de populações de soja para variáveis industriais com base em caracteres agronômicos

Autor: Maik Oliveira Silva
Přispěvatelé: Larissa Pereira Ribeiro Teodoro
Jazyk: portugalština
Rok vydání: 2022
Předmět:
Zdroj: Repositório Institucional da UFMS
Universidade Federal de Mato Grosso do Sul (UFMS)
instacron:UFMS
Popis: Soybean is an important food alternative in human nutrition, because it has a high protein quality. The great current challenge of genetic improvement programs is to increase grain yield and protein content and at least maintain oil content. Hence the importance of getting the oil or protein content with a high percentage of correct classification. One of the promising approaches for classifying variables and/or complex data sets is machine learning (AM). The objective was to classify groups of soybean genotypes according to industrial variables based on agronomic characters using AM techniques. The experiment was conducted in the 2019/2020 harvest at the Federal University of Mato Grosso do Sul, in Chapadão do Sul and at the State University of Mato Grosso do Sul, in Aquidauana. A randomized block design with two replications and 206 F2 soybean populations was used. The agronomic characters evaluated were: days to maturation (DM), height of insertion of the first pod (AIV, cm), plant height (AP, cm), number of branches (NR), diameter of the main stem (DHP, cm), mass of one hundred grains (MCG, g) and grain yield (PROD, kg ha-1). The models tested were: support vector machine (SVM), artificial neural networks (ANN), decision tree models J48 and REPTree (RT) and random forest (RF). Using AM techniques, accurate models were generated for classifying more complex variables that require more time to obtain them as oil and proteins in soybeans, based on agronomic traits, which are easier to measure. RF was the technique with the best performance and can be used to contribute to soybean breeding programs by classifying genotypes for industrial traits such as oil and protein content. A soja é uma importante alternativa alimentar na nutrição humana, por apresentar alto teor de qualidade proteica. O grande desafio atual dos programas de melhoramento genético é aumentar a produtividade de grãos e o teor de proteína e, pelo menos, manter o teor de óleo. Por isso a importância de se alcançar classificações acuradas de genótipos para teor de óleo e proteína com alta porcentagem de classificação correta. Uma das abordagens promissoras para classificação de variáveis e/ou conjunto de dados complexos é a aprendizagem de máquina (AM). O objetivo foi classificar grupos de genótipos de soja quanto a variáveis industriais com base em caracteres agronômicos utilizando técnicas de AM. O experimento foi conduzido na safra 2019/2020 na Universidade Federal de Mato Grosso do Sul, em Chapadão do Sul e na Universidade Estadual de Mato Grosso do Sul, em Aquidauana. Foi utilizado o delineamento de blocos casualizados com duas repetições e 206 populações F2 de soja. Os caracteres agronômicos avaliados foram: dias para maturação (DM), altura de inserção da primeira vagem (AIV, cm), altura de plantas (AP, cm), número de ramificações (NR), diâmetro da haste principal (DHP, cm), massa de cem grãos (MCG, g) e produtividade de grãos (PROD, kg ha-1). Os modelos testados foram: máquina de vetor suporte (SVM), redes neurais artificiais (ANN), os modelos de árvores de decisão J48 e REPTree (RT) e floresta aleatória (RF). Utilizando técnicas de AM, gerou-se modelos acurados de classificação de variáveis mais complexas que demandam maior tempo para a sua obtenção como óleo e proteínas em soja, com base em caracteres agronômicos, que são de mais fácil mensuração. O RF foi a técnica com melhor desempenho e pode ser utilizada para contribuir com programas de melhoramento genético de soja por meio da classificação de genótipos quanto a caracteres industriais como teor de óleo e proteína.
Databáze: OpenAIRE