Aplicación de Modelos de Supervivencia clásicos y de machine learning para el estudio de fallos de tuberías

Autor: Mogrovejo Quizhpi, Pedro Andrés
Jazyk: Spanish; Castilian
Rok vydání: 2023
Předmět:
Popis: [ES] Hoy en día, el bienestar de la sociedad es una prioridad, y parte de este bienestar viene dado por un servicio esencial como es el acceso al agua, para lo cual se requiere una red de tuberías a lo largo de las ciudades, algunas de las cuales se encuentran bajo sus carreteras. Este Trabajo de Fin de Máster considera los datos de una ciudad del Mediterráneo con una población de tamaño medio. Esta ciudad requiere un suministro regular, para lo cual el mantenimiento de las tuberías es de gran importancia, ya que un fallo causaría molestias a los habitantes y pérdidas económicas. Este estudio propone aplicar modelos de supervivencia clásicos y de machine learning, que permiten no sólo predecir sino también aportar información sobre las características que provocan las roturas de las tuberías. La implementación y comparación de los modelos se ha realizado con el software libre R. Una vez ajustados los modelos, se validaron mediante las respectivas matrices de confusión y el área bajo la curva ROC (AUC). El mejor modelo obtenido fue el modelo Random Survival Forest (RSF) con un AUC de 0,85 y una precisión del 84%, seguido del modelo lineal generalizado clásico (GLM) con un AUC y una precisión de 0,83 y 77%, respectivamente.
[EN] Nowadays, the welfare of society is a priority, and part of this welfare is given by an essential service such as access to water, which requires a network of pipes along the cities, some of which are located under their roads. This Master's thesis considers data from a Mediterranean city with a medium-sized population. This city requires a regular supply, for which the maintenance of the pipelines is of great importance, since a failure would cause inconvenience to the inhabitants and economic losses. This study proposes to apply classical and machine learning survival models, which allow not only to predict but also to provide information about the characteristics that cause pipe breaks. The implementation and comparison of the models was carried out with the free software R. Once the models were adjusted, they were validated by means of the respective confusion matrices and the area under the ROC curve (AUC). The best model obtained was the Random Survival Forest (RSF) model with an AUC of 0.85 and an accuracy of 84%, followed by the classical generalized linear model (GLM) with an AUC and accuracy of 0.83 and 77%, respectively.
Databáze: OpenAIRE