Divergencia de Rényi y métodos de kernel para tests de gaussianidad

Autor: Martí Espelt, Aniol
Přispěvatelé: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Riba Sagarra, Jaume
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Popis: Gaussianity tests have been used for decades in statistics to determine if a dataset is well modeled by a normal distribution. More recently, they have also found their place in machine learning. The reason of this proliferation is that some parametric methods are only applicable to normal distributions. On the other hand, the number of applications of information theory to statistical signal processing has grown over the years. In this thesis we use information-theoretic metrics to test normality. Focusing on a moderate computational complexity, we define Rényi negentropy and propose a plug-in estimator of it based on Kernel Density Estimation (KDE). In order to evaluate the performance of the estimator, we feed it with normal, uniform and triangular data and we compute its Mean Squared Error (MSE). Finally, we establish the initial steps of two Gaussianity detection problems based on the proposed estimator and U-statistics, respectively. Los tests de gaussianidad se han utilizado durante décadas en estadística para determinar si un conjunto de datos está bien moldeado por una distribución normal. Más recientemente, también han encontrado su sitio en el aprendizaje automático. La razón de esa proliferación es que algunos métodos paramétricos sólo son aplicables a distribuciones normales. Por otra parte, el número de aplicaciones de la teoría de la información en el procesamiento de señal estadístico ha crecido a lo largo de los años. En esta tesis utilizamos métricas procedentes de la teoría de la información para elaborar tests de normalidad. Centrándonos en conseguir una complejidad computacional moderada, definimos la neguentropía de Rényi y proponemos un estimador basado en la kernel density estimation (KDE). Para evaluar el rendimiento del estimador, lo alimentamos con datos normales, uniformes y triangulares y calculamos su error cuadrático medio (MSE). Por último, establecemos los pasos iniciales de dos problemas de detección de gaussianidad basados ??en el estimador propuesto anteriormente y en U-statistics, respectivamente. Els tests de gaussianitat s'han utilitzat durant dècades en estadística per tal de determinar si un conjunt de dades està ben modelat per una distribució normal. Més recentment, també han trobat el seu lloc en l'aprenentatge automàtic. La raó d'aquesta proliferació és que alguns mètodes paramètrics només són aplicables a distribucions normals. D'altra banda, el nombre d'aplicacions de la teoria de la informació al processament de senyal estadístic ha crescut al llarg dels anys. En aquesta tesi fem servir mètriques procedents de la teoria de la informació per elaborar tests de normalitat. Centrant-nos en aconseguir una complexitat computacional moderada, definim la neguentropia de Rényi i en proposem un estimador basat en la kernel density estimation (KDE). Per avaluar el rendiment de l'estimador, l'alimentem amb dades normals, uniformes i triangulars i en calculem l'error quadràtic mig (MSE). Finalment, establim els passos inicials de dos problemes de detecció de gaussianitat basats en l'estimador proposat anteriorment i en U-statistics, respectivament.
Databáze: OpenAIRE