Métodos de regresión y clasificación basados en árboles

Autor: Fernández Villafañez, Sergio
Přispěvatelé: García Escudero, Luis Ángel, Universidad de Valladolid. Escuela de Ingenierías Industriales
Rok vydání: 2022
Předmět:
Zdroj: UVaDOC. Repositorio Documental de la Universidad de Valladolid
instname
Popis: Las empresas cuentan en la actualidad con grandes cantidades de datos, que son adquiridos de forma muy automatizada. Es de suma importancia para estas empresas dar un uso adecuado a estos datos y contar con procedimientos, basados en dichos datos, que sirvan de ayuda a la toma de decisiones y que permitan generar ventajas competitivas respecto a sus competidores. El Aprendizaje Automático proporciona técnicas eficientes para realizar predicciones basándose en la experiencia adquirida con los datos disponibles mediante potentes métodos numéricos y estadísticos. En esta memoria se presentan algunas de estas técnicas de Aprendizaje Automático basadas en árboles de decisión, que sirven para la predicción de variables numéricas y cualitativas. A pesar de su aparente simplicidad, los árboles de regresión y clasificación proporcionan técnicas predictivas efectivas y su extensión a los "bosques aleatorios" es una de las técnicas recientes más recomendables en Aprendizaje Automático. Esta memoria también trata su aplicación práctica mediante software estadístico.
Companies today have vast amounts of data, which is acquired in a highly automated manner. For these companies, it is of great importance to make proper use of this data and to apply data-based procedures that help them make decisions and that allow them to generate competitive advantages over their competitors. Machine Learning provides efficient techniques to learn from data using powerful numerical and statistical methods. This work reviews some machine learning tools, which are used for the prediction of numerical and qualitative variables based on trees. Despite its apparent simplicity, regression and classification trees provide effective predictive techniques and their extension to "random forests" is one of the most recommended recent techniques in Machine Learning. This work also deals with its practical application through statistical software.
Departamento de Estadística e Investigación Operativa
Grado en Ingeniería en Organización Industrial
Databáze: OpenAIRE