Mapeamento de perigo de deslizamentos de terra e inundações : proposição.de abordagem utilizando processamento de linguagem natural e aprendizado de máquina

Autor: RODRIGUES, Saulo Guilherme
Přispěvatelé: ALENCAR, Marcelo Hazin
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: Repositório Institucional da UFPE
Universidade Federal de Pernambuco (UFPE)
instacron:UFPE
Popis: CAPES Inundações e os deslizamentos de terra são desastres naturais que possuem alto potencial de dano além de apresentarem tendência crescente em termos de frequência e intensidade. Entretanto, um problema comumente enfrentado por pesquisadores ao tentarem estabelecer maneiras eficientes para gerenciar o risco de tais eventos é a indisponibilidade de dados e a dificuldade das técnicas convencionais em modelarem as relações complexas de formação de tais eventos. Tendo em vista tais questões, o objetivo do presente estudo é desenvolver um modelo para mapeamento de perigo de deslizamentos de terra e inundações com dados semiestruturados advindos de linguagem natural na forma textual, provenientes de chamadas telefônicas realizadas à órgão competente, para formar um inventário de eventos georreferenciados e com base nesse inventário mapear o perigo de deslizamentos e inundações. Para alcançar tal objetivo, foram ajustados três modelos baseados em algoritmos de aprendizado de máquina. O primeiro treinou o algoritmo Naive Bayes com 42000 registros textuais para classificá-los segundo seu conteúdo e formar o inventário de eventos. Os dois últimos modelos utilizaram o algoritmo Random Forest integrados com GIS para criar mapas de perigo de inundações e deslizamentos de terras. O modelo proposto foi testado na cidade de Recife-PE, Brasil, obtendo bom desempenho, tendo o modelo de classificação textual acurácia de 0,8671. Por sua vez o modelo para classificação do perigo de inundação obteve acuraria de 0,80 e AUCROC de 0,91. Por fim, o modelo de deslizamentos de terra obteve acuraria de 0,95 e AUC-ROC de 0,99. Além das avaliações quantitativas da performance, foram realizadas avaliações qualitativas, comparando os resultados gerados com notícias jornalísticas. Em todos os testes o modelo proposto apresentou resultados satisfatórios quando comparado àqueles publicados na literatura, auxiliando as partes interessadas no processo de gerenciamento de risco de desastres naturais. Floods and landslides are natural disasters that have a high potential for damage in addition to an increasing trend in terms of frequency and intensity. However, a problem commonly faced by researchers when trying to establish efficient ways to manage the risk of such events is the unavailability of data and the difficulty of conventional techniques in modeling the complex relationships of the formation of such events. Given these issues, the objective of the present study is to develop an approach for mapping the danger of landslides and floods with semi-structured data from natural language in textual form, from telephone calls made to the competent body, to form an inventory of georeferenced events and based on this inventory map the danger of landslides and floods. Three models based on machine learning algorithms were adjusted. The first trained the Naive Bayes algorithm with 42,000 textual records to classify them according to their content and form the inventory of events. The last two models used the Random Forest algorithm integrated with GIS to create flood hazard maps and landslides. The proposed approach was tested in the city of Recife-PE, Brazil, obtaining good performance, with a textual classification model of 0.8671 accuracy. In turn, the flood hazard classification model obtained an accuracy of 0.80 and AUC-ROC of 0.91. Finally, the landslide model obtained an accuracy of 0.95 and AUC-ROC of 0.99. In addition to quantitative performance evaluations, qualitative evaluations were carried out, comparing the results generated with news reports. In all tests, the proposed approach showed results equal to or greater than those mentioned in the literature. In all tests, the proposed model presented satisfactory results when compared to those published in the literature, helping stakeholders in the process of managing natural disaster risk.
Databáze: OpenAIRE