Analysis of the Port Authority of Santander databases using predictive techniques

Autor: Carpintero Borrajo, Claudia
Přispěvatelé: García Saiz, Diego, García Avellán, Juan Antonio
Jazyk: Spanish; Castilian
Rok vydání: 2022
Popis: Trabajo fin de Máster defendido en la Facultad de Ciencias de la Universidad de Cantabria, el 15 de julio de 2022 -Curso 2021-2022 - Máster Interuniversitario en Ciencia de Datos / Master in Data Science (UIMP-UC-CSIC)
[EN] This paper will analyze the data obtained from the Port of Santander. These data include both the number of ships that are in the port every day, as well as the actions that are being carried out on them and the characteristics of each one of them. In addition, there are records of the entries and exits of vehicles through each of the land accesses to the Port of Santander. The main objective is to understand what factors affect the delays produced in the depar- tures of vehicles with goods by road in the Port of Santander. Among other things, we will check whether the loading/unloading of certain types of goods contributes and to what extent. Secondly, predictions will be made on the number of vehicles with goods that will be leaved. This will make it possible to establish certain warnings that will alert the Port workers and thus enable alternative exits before the only one that exists is jammed. In order to answer the questions posed, a correlation analysis will be carried out first. The methods to be used will be: Pearson, Spearman, Kendall and Jakknife. However, principal component analysis will also be used to try to refine the set of variables. Finally, two super- vised learning models will be created to provide an answer to the regression problem. These models will be compared in search of the one that best fits the available data and will be chosen according to the results obtained.
[ES] En el presente trabajo se analizarán los datos obtenidos del Puerto de Santander. Estos datos engloban tanto la cantidad de buques que se encuentran en el Puerto cada día, como las acciones que en ellos se están realizando y las características de cada uno. Además, se tienen registros de las entradas y salidas de vehículos por cada uno de los accesos terrestres al Puerto de Santander. Como objetivo principal, se busca comprender qué factores afectan a las retenciones producidas en las salidas de vehículos con mercancía por carretera en el Puerto de Santander. Entre otros, se comprobará si la carga/descarga de determinados tipos de mercancías contribuye y en qué medida. En segundo lugar, se realizarán predicciones sobre la cantidad de vehículos con mercancías que salen del Puerto. Esto permitirá establecer ciertos avisos que pongan en alerta a los trabajadores del Puerto y así poder habilitar salidas alternativas antes de que se atasque la única que hay. Para dar respuesta a las cuestiones planteadas, se realizará en primer lugar, un análisis de correlaciones. Los métodos que se utilizarán serán: Pearson, Spearman, Kendall y Jakknife. Sin embargo, se utilizará también el análisis de componentes principales para tratar de refinar el conjunto de variables. Por último, se crearán dos modelos de aprendizaje supervisado con los que se buscará dar respuesta al problema de regresión. Estos modelos se compararán en busca del que mejor se adapte a los datos disponibles y se elegirán de acuerdo a los resultados que vayan obteniéndose.
Databáze: OpenAIRE