Reconeixement intel·ligent de malalties oculars mitjançant arquitectures d'aprenentatge profund

Autor: Coll Corbilla, Jordi
Přispěvatelé: Nuñez Do Rio, Joan Manuel, Ventura Royo, Carles
Rok vydání: 2019
Předmět:
Zdroj: O2, repositorio institucional de la UOC
Universitat Oberta de Catalunya (UOC)
Popis: Les patologies de la retina són la causa més comuna de ceguesa infantil a tot el món. La detecció ràpida i automàtica de malalties és crítica i urgent per a reduir la càrrega de treball dels oftalmòlegs. Els oftalmòlegs diagnostiquen malalties basant-se en el reconeixement de patrons mitjançant la visualització directa o indirecta de l'ull i les seves estructures circumdants. La dependència amb el fons d'ull i la seva anàlisi fa que el camp de l'oftalmologia sigui perfectament adequat per beneficiar-se d'algorismes de deep learning. Cada malaltia té diferents estadis de severitat que es poden deduir verificant l'existència de lesions específiques i cada lesió es caracteritza per certs trets morfològics on diverses lesions de diferents patologies tenen característiques similars. Observem que els pacients poden veure's afectats simultàniament per diverses patologies i en conseqüència, la detecció de malalties oculars presenta una classificació amb múltiples etiquetes amb un principi de resolució complex. S'estudien dues solucions de deep learning per la detecció automàtica de múltiples malalties oculars. Les solucions que s'han escollit són a causa del seu major rendiment i puntuació final en el repte ILSVRC: GoogLeNet i VGGNet. Primer, estudiem les diferents característiques de les lesions i definim els passos fonamentals del processament de les dades. Posteriorment, identifiquem el programari i el maquinari necessaris per executar les solucions d'aprenentatge profund. Finalment, investiguem els principis d'experimentació implicats per avaluar els diferents mètodes, la base de dades pública utilitzada per a les fases d'entrenament i validació i es reporta i es discuteix la precisió final de detecció amb altres mètriques importants. Retinal pathologies are the most common cause of childhood blindness worldwide. Rapid and automatic detection of diseases is critical and urgent in reducing the ophthalmologist's workload. Ophthalmologists diagnose diseases based on pattern recognition through direct or indirect visualization of the eye and its surrounding structures. Dependence on the fundus of the eye and its analysis make the field of ophthalmology perfectly suited to benefit from deep learning algorithms. Each disease has different stages of severity that can be deduced by verifying the existence of specific lesions and each lesion is characterized by certain morphological features where several lesions of different pathologies have similar characteristics. We note that patients may be simultaneously affected by various pathologies, and consequently, the detection of eye diseases has a multi-label classification with a complex resolution principle. Two deep learning solutions are being studied for the automatic detection of multiple eye diseases. The solutions chosen are due to their higher performance and final score in the ILSVRC challenge: GoogLeNet and VGGNet. First, we study the different characteristics of lesions and define the fundamental steps of data processing. We then identify the software and hardware needed to execute deep learning solutions. Finally, we investigate the principles of experimentation involved in evaluating the various methods, the public database used for the training and validation phases, and report the final detection accuracy with other important metrics. Las patologías de la retina son la causa más común de ceguera infantil en todo el mundo. La detección rápida y automática de dolencias es crítica y urgente para reducir la carga de trabajo de los oftalmólogos. Los oftalmólogos diagnostican dolencias basándose en el reconocimiento de patrones mediante la visualización directa o indirecta del ojo y sus estructuras circundantes. La dependencia con el fondo de ojo y su análisis hace que el campo de la oftalmología sea perfectamente adecuado para beneficiarse de algoritmos de deep learning. Cada dolencia tiene diferentes estadios de severidad que se pueden deducir verificando la existencia de lesiones específicas y cada lesión se caracteriza por ciertos rasgos morfológicos donde varias lesiones de diferentes patologías tienen características similares. Observamos que los pacientes pueden verse afectados simultáneamente por varias patologías y en consecuencia, la detección de dolencias oculares presenta una clasificación con múltiples hashtags con un principio de resolución complejo. Se estudian dos soluciones de deep learning por la detección automática de múltiples dolencias oculares. Las soluciones que se han escogido son a causa de su mayor rendimiento y puntuación final en el reto ILSVRC: GoogLeNet y VGGNet. Primero, estudiamos las diferentes características de las lesiones y definimos los pasos fundamentales del procesamiento de los datos. Posteriormente, identificamos el software y el hardware necesarios para ejecutar las soluciones de aprendizaje profundo. Finalmente, investigamos los principios de experimentación implicados para evaluar los diferentes métodos, la base de datos pública utilizada para las fases de entrenamiento y validación y se reporta y se discute la precisión final de detección con otras métricas importantes.
Databáze: OpenAIRE