Ensembled method based on artificial neural networks for the estimation of respiratory diseases

Autor: Lazzarin, Lilian do Nascimento Araujo
Přispěvatelé: Siqueira, Hugo Valadares, Tadano, Yara de Souza, Bastos Filho, Carmelo José Albanez, Góis, Lourival Aparecido de, Alves, Thiago Antonini
Jazyk: portugalština
Rok vydání: 2019
Předmět:
Zdroj: Repositório Institucional da UTFPR (da Universidade Tecnológica Federal do Paraná (RIUT))
Universidade Tecnológica Federal do Paraná (UTFPR)
instacron:UTFPR
Popis: As redes neurais artificiais são aproximadores universais e ferramentas eficientes para solução de problemas de mapeamento, interpolação e previsão. Uma outra abordagem que tem sido explorada na última década é o método ensemble, que combina as saídas de diversos preditores. Estas ferramentas são eficientes na solução de uma grande variedade de problemas. Entretanto, não é comum utilizá-las na previsão de problemas de saúde causados pela poluição atmosférica. A poluição do ar é um tema que há anos chama a atenção dos pesquisadores de diversas áreas, principalmente pelos danos que causa à saúde humana. São vários os estudos que relacionam alguns poluentes encontrados no ar com o número de internações por doenças respiratórias, e esses estudos geralmente aplicam métodos de regressão estatística. Portanto, este trabalho analisa a aplicação de 10 modelos de redes neurais e 4 possibilidades de ensemble na previsão do número de internações por doenças respiratórias causadas por poluentes atmosféricos. Estas novas abordagens foram comparadas com os resultados do modelo linear generalizado (MLG) com regressão de Poisson, que é comumente utilizado neste tipo de problema. Além disso, no presente estudo, uma nova proposta de uso do MLG é introduzida, com a simplificação do pré- processamento por meio do uso de uma normalização, em que substituiu-se o spline utilizado no MLG pelo método de dessazonalidade dos dados juntamente com o cálculo dos coeficientes ótimos via otimização por enxame de partículas. O estudo de caso envolveu dados de poluição, especificamente de material particulado com diâmetro aerodinâmico menor ou igual à 10m (MP10) e dados meteorológicos, como a temperatura média e a umidade relativa do ar, das cidades de Campinas e São Paulo. A saída desejada dos modelos é o número de internações por doenças respiratórias. Os resultados mostraram que, o MLG/PSO foi melhor que a proposta clássica para São Paulo. Entretanto, vale salientar que os resultados gerais indicam fortemente que os modelos lineares não conseguem atingir desempenhos superiores aos não-lineares. Neste mesmo cenário, o modelo desorganizado da ESN de Ozturk pôde superar todas as metodologias recorrentes clássicas. Para o efeito 7 dias após a exposição, constata-se que o ensemble usando como combinador a rede perceptron de múltiplas camadas chegou aos melhores resultados gerais em termos do erro quadrático médio, em ambos os cenários. Diante dos resultados, pode-se concluir que o uso de redes neurais artificiais trouxe benefícios para o problema abordado e se ajustou melhor aos dados do que os modelos clássicos de regressão estatística. Artificial neural networks are universal approximations and efficient tools for solving mapping, interpolation and prediction problems. Another approach that has been explored in the last decade is the ensemble method, which combines the outputs of various predictors. These tools are efficient in solving a wide variety of problems. However, it is not common to use them in forecasting health problems caused by atmospheric pollution. Air Pollution is a theme that for years has attracted the attention of researchers in many areas, mainly because of the damage it causes to human health. There are several studies that relate some pollutants found in the air to the number of hospitalizations for respiratory diseases, and these studies generally apply methods of statistical regression. Therefore, this paper analyzes the application of 10 neural networks models and 4 possibilities of forecasting the number of hospitalizations for respiratory diseases caused by air pollutants. These new approaches were compared with the results of the generalized linear model (GLM) with Poisson regression, which is commonly used in this kind of problem. In addition, in the present study, a new proposal for the use of the GLM is introduced, with the simplification of the pre-processing through the use of a normalization, in which the spline used in the MLG is replaced by the seasonality of the data together with optimal coefficients calculation by means of swarm of particles. The case study involves pollution data, particulate matter with aerodynamic diameter less than or equal to 10m (MP10) and meteological data, such as mean temperature and relative humidity, of Campinas and São Paulo cities. The desired output of the models is the number of hospitalizations for respiratory diseases. The results showed that, GLM/PSO was better than the classical proposal to Sao Paulo. However, we highlight that the general results strongly indicates that the linear models are not able to reach superior performances thant the non-linear ones. In this same scenario, the unorganized Ozturk ESN model surpassed all the recurrent classic methodologies. To the effect seven days after exposure, it was found that ensemble using multiple layers percetron as combinator reached the best overall results in terms of mean square error, in both scenarios. According to the results, we may conclude that the use of artificial neural networks brought benefits to the addressed topic and had a better adjustment than the classical models of statistical regression.
Databáze: OpenAIRE