Aplicación de Modelos de Supervivencia clásicos y de machine learning para el estudio de fallos de tuberías
Autor: | Mogrovejo Quizhpi, Pedro Andrés |
---|---|
Jazyk: | Spanish; Castilian |
Rok vydání: | 2023 |
Předmět: |
Suministro de agua potable
MECANICA DE FLUIDOS Curva ROC ESTADISTICA E INVESTIGACION OPERATIVA Drinking water networks Análisis ROC Random survival forest (RSF) ROC curve Modelos de supervivencia Survival models Redes de agua potable Drinking water supply Máster Universitario en Ingeniería de Análisis de Datos Mejora de Procesos y Toma de Decisiones-Màster Universitari en Enginyeria D'Anàlisi de Dades Millora de Processos i Presa de Decisions ROC analysis Receiver operating characteristic curves |
Popis: | [ES] Hoy en día, el bienestar de la sociedad es una prioridad, y parte de este bienestar viene dado por un servicio esencial como es el acceso al agua, para lo cual se requiere una red de tuberías a lo largo de las ciudades, algunas de las cuales se encuentran bajo sus carreteras. Este Trabajo de Fin de Máster considera los datos de una ciudad del Mediterráneo con una población de tamaño medio. Esta ciudad requiere un suministro regular, para lo cual el mantenimiento de las tuberías es de gran importancia, ya que un fallo causaría molestias a los habitantes y pérdidas económicas. Este estudio propone aplicar modelos de supervivencia clásicos y de machine learning, que permiten no sólo predecir sino también aportar información sobre las características que provocan las roturas de las tuberías. La implementación y comparación de los modelos se ha realizado con el software libre R. Una vez ajustados los modelos, se validaron mediante las respectivas matrices de confusión y el área bajo la curva ROC (AUC). El mejor modelo obtenido fue el modelo Random Survival Forest (RSF) con un AUC de 0,85 y una precisión del 84%, seguido del modelo lineal generalizado clásico (GLM) con un AUC y una precisión de 0,83 y 77%, respectivamente. [EN] Nowadays, the welfare of society is a priority, and part of this welfare is given by an essential service such as access to water, which requires a network of pipes along the cities, some of which are located under their roads. This Master's thesis considers data from a Mediterranean city with a medium-sized population. This city requires a regular supply, for which the maintenance of the pipelines is of great importance, since a failure would cause inconvenience to the inhabitants and economic losses. This study proposes to apply classical and machine learning survival models, which allow not only to predict but also to provide information about the characteristics that cause pipe breaks. The implementation and comparison of the models was carried out with the free software R. Once the models were adjusted, they were validated by means of the respective confusion matrices and the area under the ROC curve (AUC). The best model obtained was the Random Survival Forest (RSF) model with an AUC of 0.85 and an accuracy of 84%, followed by the classical generalized linear model (GLM) with an AUC and accuracy of 0.83 and 77%, respectively. |
Databáze: | OpenAIRE |
Externí odkaz: |