Data mining for prediction of extreme rainfall events
Autor: | Charles, Anderson Cordeiro |
---|---|
Přispěvatelé: | Namen, Anderson Amendoeira, Rodrigues, Pedro Paulo Gomes Watts, Miranda, Ricardo Augusto Calheiros de, Oliveira, Vicente de Paulo Santos de |
Jazyk: | portugalština |
Rok vydání: | 2015 |
Předmět: |
Mineração de dados (Computação)
Artificial neural networks Decision trees Chuvas Modelos matemáticos Inundações Previsão Redes neurais artificiais Índices de instabilidade Weather. instability rates Precipitação (Meteorologia) Métodos de simulação CIENCIAS EXATAS E DA TERRA::GEOCIENCIAS::METEOROLOGIA::METEOROLOGIA APLICADA [CNPQ] Meteorologia Árvores de decisão Data mining Controle de inundações |
Zdroj: | Biblioteca Digital de Teses e Dissertações da UERJ Universidade do Estado do Rio de Janeiro (UERJ) instacron:UERJ |
Popis: | Submitted by Boris Flegr (boris@uerj.br) on 2021-01-07T14:41:58Z No. of bitstreams: 1 Dissertacao_AndersonCordeiroCharles.pdf: 2134509 bytes, checksum: b82a592dec4c092f5bffd954eed227fd (MD5) Made available in DSpace on 2021-01-07T14:41:58Z (GMT). No. of bitstreams: 1 Dissertacao_AndersonCordeiroCharles.pdf: 2134509 bytes, checksum: b82a592dec4c092f5bffd954eed227fd (MD5) Previous issue date: 2015-09-21 Data mining classification models were applied in this work in order to predict extreme climatic events one hour in advance. Data (2008 2012) extracted from the surface meteorological station located at the Polytechnic Institute of Rio de Janeiro State University in Nova Friburgo (RJ) were used. The knowledge discovery in databases (KDD) process was applied, comprising the data preparation, its mining and its post processing. Artificial neural networks and decision tree algorithms were used to identify patterns that indicates accumulation of precipitation above 10 mm in the following hour. It was observed that the use of weather observational data in micro scale was susceptible to high false positive rates in the short term prediction. In order to solve this problem, historical data of predictions performed by the ETA Model with resolution of 15 km were inserted into the model construction process. This data has been made available from the Weather Prediction and Climate Studies Center of the National Institute for Space Research - CPTEC/INPE. The work included the calculation of the instability index related to the formation of a severe convective situation at the region of Nova Friburgo and its store at a database, joining the micro and meso scale records. The obtained results demonstrated that the union between databases was extremely important to reduce the high false positive rates. This was a very important contribution to the meteorological studies performed in surface meteorological stations. The model with the highest accuracy was used to develop a real time alert system which verifies the possibility of torrential rains occurrences (10 mm or more) one hour ahead. No presente trabalho foram desenvolvidos modelos de classificação aplicados à mineração de dados climáticos para a previsão de eventos extremos de precipitação com uma hora de antecedência. Mais especificamente, foram utilizados dados observacionais registrados pela estação meteorológica de superfície localizada no Instituto Politécnico da Universidade do Estado do Rio de Janeiro em Nova Friburgo RJ, durante o período de 2008 a 2012. A partir desses dados foi aplicado o processo de Descoberta de Conhecimento em Banco de Dados (KDD Knowledge Discovery in Databases), composto das etapas de preparação, mineração e pós processamento dos dados. Com base no uso de algoritmos de Redes Neurais Artificiais e Árvores de Decisão para a extração de padrões que indicassem um acúmulo de precipitação maior que 10 mm na hora posterior à medição das variáveis climáticas, pôde-se notar que a utilização da observação meteorológica de micro escala para previsões de curto prazo é suscetível a altas taxas de alarmes falsos (falsos positivos). Para contornar este problema, foram utilizados dados históricos de previsões realizadas pelo Modelo Eta com resolução de 15 km, disponibilizados pelo Centro de Previsão de Tempo e Estudos Climáticos do Instituto Nacional de Pesquisas Espaciais CPTEC/INPE. De posse desses dados, foi possível calcular os índices de instabilidade relacionados à formação de situação convectiva severa na região de Nova Friburgo e então armazená-los de maneira estruturada em um banco de dados, realizando a união entre os registros de micro e meso escala. Os resultados demonstraram que a união entre as bases de dados foi de extrema importância para a redução dos índices de falsos positivos, sendo essa uma importante contribuição aos estudos meteorológicos realizados em estações meteorológicas de superfície. Por fim, o modelo com maior precisão foi utilizado para o desenvolvimento de um sistema de alertas em tempo real, que verifica, para a região estudada, a possibilidade de chuva maior que 10 mm na próxima hora. |
Databáze: | OpenAIRE |
Externí odkaz: |