Previsão de tendência de preços do boi gordo no Estado de São Paulo utilizando o Random Forest

Autor: Mion, Renan Marcel Ribeiro
Přispěvatelé: Escolas::EESP, Cipparrone, Flavio Almeida de Magalhães, Maialy, Andre Cury, Rochman, Ricardo Ratner
Jazyk: portugalština
Rok vydání: 2019
Předmět:
Zdroj: Repositório Institucional do FGV (FGV Repositório Digital)
Fundação Getulio Vargas (FGV)
instacron:FGV
Popis: Este trabalho tem como objetivo prever a tendência de preços do boi gordo no Estado de São Paulo, utilizando o algoritmo de aprendizagem de máquina supervisionado Random Forest. Para executar esta tarefa, recorre-se ao processo de mineração de dados a fim de se extrair as principais características preditivas, que foram julgadas como importantes na formação de preço do boi gordo, a partir de uma base de dados contendo séries diárias de diversos componentes da cadeia agropecuária. Os principais previsores encontrados foram as relações de troca entre o boi gordo e o milho, boi gordo e boi magro, boi gordo e bezerro. Adicionalmente, também foram considerados o equivalente físico, este como indicador de margem de comercialização da carne no mercado interno, histórico acumulado de chuvas, preços da carne in natura para a exportação e escalas de abate na modelagem. As novas variáveis foram utilizadas para treinar e testar o modelo, de modo a encontrar um período ótimo para se efetuar a previsão de preços, conforme as informações obtidas nas métricas de performance: acurácia, revocação, precisão e f1-score. Neste processo também identificou-se a necessidade de defasar a série de preços da arroba do boi gordo para melhorar a performance do algoritmo. O backtesting do modelo proporcionou resultados interessantes vis-à-vis as métricas de performance, e ao ser comparado também com os dados reais. Por fim, o trabalho ilustrará a ordem de importância das características no processo de predição. This paper aims to predict the cattle’s quote trend in the State of São Paulo, using the supervised machine learning algorithm Random Forest. To perform this task, the data mining process was required, in order to extract the main predictive features, which were judged as important in the price formation of the cattle, from a database containing daily series of several components of the agricultural chain. The main predictors found were the relationships between cattle and maize, cattle and lean cattle, cattle and calf. In addition was also considered the pysical equivalent, as an indicator of domestic commercialization margin, an accumulated rainfall data base, meat prices for export and slaughter scales during the modeling. The new variables were applied to train and test the model, in order to find an optimal period to make the price forecast, according to the information obtained in the following performance metrics: accuracy, recall, precision and f1-score. In this process it was also identified the need to lag the cattle’s price series to improve the algorithm performance. The backtesting of the model provided interesting results vis-à-vis the performance metrics, and when compared to the real data as well. Finally, the paper will illustrate the features of importance during the prediction process.
Databáze: OpenAIRE