Popis: |
Density estimation methods can be used to solve a variety of statistical and machine learning challenges. They can be used to tackle a variety of problems, including anomaly detection, generative models, semi-supervised learning, compression, and text-to-speech. A popular technique to find density estimates for new samples in a non parametric set up is Kernel Density Estimation, a method which suffers from costly evaluations especially for large data sets and higher dimensions. In this thesis we want to compare the performance of the novel method Kernel Density Estimation using Density Matrices introduced by González et al. [9] against other state-of-the-art fast procedures for estimating the probability density function in different sets of complex synthetic scenarios. Our experimental results show that this novel method is a competitive strategy to calculate density estimates among its competitors and also show advantages when performing on large data sets and high dimensions. Los métodos de estimación de densidad se pueden aplicar a diferentes problemas en estadística y aprendizaje automático. Se pueden utilizar para resolver tareas como detección de anomalías, modelos generativos, aprendizaje semi-supervisado, compresión, conversión de texto a voz, entre otras. Una técnica popular para encontrar estimaciones de densidad de nuevas muestras en una configuración no paramétrica se realiza a través de Estimación Kernel de Densidad, un método que adolece de evaluaciones costosas, especialmente para conjuntos de datos grandes y dimensiones altas. En esta tesis queremos comparar el rendimiento del método novedoso Estimación Kernel de Densidad usando Matrices de Densidad introducido por González et al. [9] con otros procedimientos rápidos estado-del-arte para estimar la función de densidad de probabilidad en diferentes conjuntos de escenarios sintéticos complejos. Nuestros resultados experimentales muestran que este novedoso método es una estrategia competitiva de calcular estimaciones de densidad entre sus competidores y también muestra ventajas cuando se trabaja con grandes conjuntos de datos y altas dimensiones. El software utilizado para probar el método propuesto está disponible en línea. (Texto tomado de la fuente) Pregrado Estadístico Quantum Machine Learning |