Popis: |
A presente dissertação consiste na análise de séries temporais especificamente o modelo do tipo SARIMA e análise de regressão múltipla, na modelação e previsão do índice de produção industrial de Cabo Verde. Para aplicação do modelo SARIMA, com base na série mensal de 2014 a 2019, foi verificada a estacionaridade pelo teste Dickey-Fuller (ADF) e KPSS, e a sazonalidade pelo teste de Kruskal–Wallis. O melhor modelo SARIMA foi escolhido com base no Critério de Informação Bayesiano (BIC), Critério de Informação Akaike (AIC) e o Critério de Informação Akaike Corrigido (AICc). A avaliação do modelo baseou-se na análise de resíduos pelo gráfico FAC e FACP e pelo teste de LjungBox. Foi incluído um modelo ARIMA (não sazonal), uma vez que a existência da sazonalidade suscitava dúvidas nas análises prévias. O outro método escolhido neste estudo é a análise do modelo de regressão múltipla. Neste método, primeiramente se verificou a existência de multicolinearidade, isto é, existência de uma correlação forte entre as variáveis independentes e fez-se esta análise pelo método VIF (variance factor inflaction). Posteriormente a avaliação do modelo que foi feita pela análise de resíduos tal como no modelo SARIMA. Neste último, a análise da normalidade foi efetuada pelo teste de Shapiro-wilk e Shapiro-Francia, a independência nos termos do erro pelo teste de DurbinWatson e a homocedasticidade pelo teste de Breusch-Pagan e White. Selecionou-se quatro modelos para previsão do índice de produção industrial de Cabo Verde, sendo três dos modelos SARIMA e um modelo da regressão múltipla. Os modelos se adequam-se aos dados, conforme as análises, e os dados previstos seguem a tendência dos dados originais. Dos quatro modelos, o modelo da regressão múltipla, modelo m3, é o modelo com erros de previsões menores e segue melhor os dados originais, portanto, o modelo que melhor prevê o índice. The present dissertation consists of a time series analysis, specifically the SARIMA type model and multiple regression analysis, to model and forecast Cape Verde’s industrial production index. The SARIMA model was applied on the monthly series from 2014 to 2019, stationarity was verified by the Dickey-Fuller (ADF) and KPSS tests, and seasonality by the Kruskal– Wallis test. The best SARIMA model was chosen based on the Bayesian Information Criterion (BIC), Akaike Information Criterion (AIC), and the Corrected Akaike Information Criterion (AICc). The model evaluation was based on the residual analysis by the ACF o PACF plot and the Ljung-Box test. An ARIMA model (non-seasonal) was also included, as the presence of seasonality implied having some doubts about the accuracy of previous analyses. The other method presented in this study is the multiple regression model. In this method, the existence of multicollinearity was checked first, that is, the existence of a strong correlation among the independent variables, and this analysis was done by the VIF method (variance factor inflation). Subsequently, the model was evaluated by the analysis of residuals as in the SARIMA model. In the latter, the analysis of normality was performed by the Shapiro-wilk and Shapiro-Francia tests, the independence of error terms by the Durbin-Watson test, and homoscedasticity by the Breusch-Pagan and White test. Four different models were selected to forecast the Cape Verde’s industrial production index. Three are SARIMA model type and one is the multiple regression model. The analyses show that the chosen models are suitable for the concerned data, and the forecast results follow the original data trend. Among the four models, the multiple regression model (m3), is the most accurate, presenting the smallest forecast errors. Therefore, we can conclude that this is the model that best predicts the behavior and the index trend. |