Mejora en la clasificación de pacientes mediante técnicas de machine learning: aplicación a un problema neurológico a partir de la obtención de 14 biomarcadores
Autor: | Quintana Luque, Manuel |
---|---|
Přispěvatelé: | Sánchez Pla, Alexandre, Pérez Hoyos, Santiago |
Rok vydání: | 2019 |
Předmět: | |
Zdroj: | O2, repositorio institucional de la UOC Universitat Oberta de Catalunya (UOC) |
Popis: | El objetivo de este trabajo es conocer si la aplicación de técnicas de machine learning es útil para mejorar la clasificación de pacientes con ictus a partir de los valores de una serie de biomarcadores. Para ello, se han utilizado los pacientes con sospecha de ictus de un estudio publicado en el cual se utilizaron modelos de regresión logística sin éxito. Se han aplicado técnicas de machine learning a los datos de entrenamiento (n=541) y se ha evaluado el rendimiento de los algoritmos obtenidos en una muestra de validación (n=766), obteniendo la capacidad diagnóstica de los modelos mediante matrices de confusión. El mejor algoritmo para clasificar ictus/mimic se ha obtenido mediante un Random Forest entrenado con 10-fold crossvalidation, consiguiendo una precisión del 86.7% en la muestra de validación. El mejor algoritmo para clasificar ictus isquémico/hemorrágico se ha obtenido mediante una red neuronal artificial entrenada con 3-fold crossvalidation, con una precisión del 86.8% en la muestra de validación. No se han mejorado los resultados de los modelos de regresión logística en la clasificación de ictus isquémico / hemorrágico, pero sí en la de ictus/mimic. No obstante, no se han alcanzado las precisiones del 90% esperadas al inicio del estudio. En conclusión, las capacidades diagnósticas de los algoritmos obtenidos mediante técnicas de Machine Learning no son muy superiores a los obtenidos mediante regresión logística. Así, hasta que no se hallen otros marcadores más potentes, no es posible clasificar más precozmente a estos pacientes, siendo necesaria la obtención de pruebas complementarias para ello. L'objectiu d'aquest treball és conèixer si l'aplicació de tècniques de machine learning és útil per millorar la classificació de pacients amb ictus a partir dels valors d'una sèrie de biomarcadors. Per a això, s'han utilitzat els pacients amb sospita d'ictus d'un estudi publicat en el qual es van utilitzar models de regressió logística sense èxit. S'han aplicat tècniques de machine learning a les dades d'entrenament (n = 541) i s'ha avaluat el rendiment dels algoritmes obtinguts en una mostra de validació (n = 766), obtenint la capacitat diagnòstica dels models mitjançant matrius de confusió. El millor algoritme per classificar ictus / mimic s'ha obtingut mitjançant un Random Forest entrenat amb 10-fold crossvalidation, aconseguint una precisió del 86.7% en la mostra de validació. El millor algoritme per classificar ictus isquèmic / hemorràgic s'ha obtingut mitjançant una xarxa neuronal artificial entrenada amb 3-fold crossvalidation, amb una precisió del 86.8% en la mostra de validació. No s'han millorat els resultats dels models de regressió logística en la classificació d'ictus isquèmic / hemorràgic, però sí en la d'ictus / mimic. Això no obstant, no s'han assolit les precisions del 90% esperades a l'inici de l'estudi. En conclusió, les capacitats diagnòstiques dels algoritmes obtinguts mitjançant tècniques de Machine Learning no són molt superiors als obtinguts mitjançant regressió logística. Així, fins que no es trobin altres marcadors més potents, no és possible classificar més precoçment a aquests pacients, sent necessària l'obtenció de proves complementàries per a això. The aim of this work is to know if the use of machine learning techniques with biomarkers is useful to improve the classification of stroke patients. For this purpose, patients with suspected stroke have been obtained from a published study in which logistic regression models were used without success. Machine Learning techniques have been applied to the training data (n = 541) and the performance of the algorithms has been evaluated in a validation sample (n = 766), obtaining the diagnostic ability of the models through the use of confusion matrices. The best algorithm to classify stroke/mimic was obtained by a Random Forest trained with 10-fold crossvalidation, obtaining an accuracy of 86.7% in the validation sample. The best algorithm to classify ischemic/hemorrhagic stroke was obtained by an artificial neural network trained with 3-fold crossvalidation, with an accuracy of 86.8% obtained in the validation sample. The results of the logistic regression models have not been improved by machine learning techniques in the classification of ischemic/hemorrhagic stroke, but an improvement was achieved in the stroke/mimic classification. However, the 90% of accuracy expected at the beginning of the study has not been reached. In conclusion, the diagnostic abilities of the algorithms obtained by Machine Learning techniques are not much higher than those obtained by logistic regression. Thus, until the obtention of new potent biomarkers, it is not possible to classify these patients earlier, being still necessary the obtention of complementary medical tests. |
Databáze: | OpenAIRE |
Externí odkaz: |