Método para la segmentación de imágenes de resonancia magnética cerebrales usando una arquitectura de red neuronal basada en modelos de atención
Autor: | Laiton Bonadiez, Camilo Andres |
---|---|
Přispěvatelé: | Sanchez Torres, German, Branch Bedoya, John Willian, Gidia: Grupo de Investigación YyDesarrollo en Inteligencia Artificial |
Jazyk: | angličtina |
Rok vydání: | 2022 |
Předmět: |
Diagnóstico por imágenes
Aprendizaje profundo 004 - Procesamiento de datos Ciencia de los computadores [000 - Ciencias de la computación información y obras generales] Deep learning Medical image segmentation Segmentación de imágenes médicas Resonancia magnética en imágenes Magnetic resonance imaging Brain structures 003 - Sistemas [000 - Ciencias de la computación información y obras generales] Transformers Redes neuronales convolucionales Diagnostic imaging 611 - Anatomía humana citología histología [610 - Medicina y salud] Convolutional neural networks Estructuras cerebrales 005 - Programación programas datos de computación [000 - Ciencias de la computación información y obras generales] |
Zdroj: | Repositorio UN Universidad Nacional de Colombia instacron:Universidad Nacional de Colombia |
Popis: | ilustraciones, diagramas, tablas In recent years, the use of deep learning-based models for developing advanced healthcare systems has been growing due to the results they can achieve. However, the majority of the proposed deep learning-models largely use convolutional and pooling operations, causing a loss in valuable data and focusing on local information. In this thesis, we propose a deep learning-based approach that uses global and local features which are of importance in the medical image segmentation process. In order to train the architecture, we used extracted three-dimensional (3D) blocks from the full magnetic resonance image resolution, which were sent through a set of successive convolutional neural network (CNN) layers free of pooling operations to extract local information. Later, we sent the resulting feature maps to successive layers of self-attention modules to obtain the global context, whose output was later dispatched to the decoder pipeline composed mostly of upsampling layers. The model was trained using the Mindboggle-101 dataset. The experimental results showed that the self-attention modules allow segmentation with a higher Mean Dice Score of 0.90 ± 0.036 compared with other UNet-based approaches. The average segmentation time was approximately 0.032 s per brain structure. The proposed model allows tackling the brain structure segmentation task properly. Exploiting the global context that the self-attention modules incorporate allows for more precise and faster segmentation. We segmented 37 brain structures and, to the best of our knowledge, it is the largest number of structures under a 3D approach using attention mechanisms. En los últimos años, el uso de modelos basados en aprendizaje profundo para el desarrollo de sistemas de salud avanzados ha ido en aumento debido a los excelentes resultados que pueden alcanzar. Sin embargo, la mayoría de los modelos de aprendizaje profundo propuestos utilizan, en gran medida, operaciones convolucionales y de pooling, lo que provoca una pérdida de datos valiosos centrándose principalmente en la información local. En esta tesis, proponemos un enfoque basado en el aprendizaje profundo que utiliza características globales y locales que son importantes en el proceso de segmentación de imágenes médicas. Para entrenar la arquitectura, utilizamos bloques tridimensionales (3D) extraídos de la resolución completa de la imagen de resonancia magnética. Estas se enviaron a través de un conjunto de capas sucesivas de redes neuronales convolucionales (CNN) libres de operaciones de pooling para extraer información local. Luego, enviamos los mapas de características resultantes a capas sucesivas de módulos de autoatención para obtener el contexto global, cuya salida se envió más tarde a la canalización del decodificador compuesta principalmente por capas de upsampling. El modelo fue entrenado usando el conjunto de datos Mindboggle-101. Los resultados experimentales mostraron que los módulos de autoatención permiten la segmentación con un Mean Dice Score 0,90 ± 0,036 la cual es mayor en comparación con otros enfoques basados en UNet. El tiempo medio de segmentación fue de aproximadamente 0,032 s por estructura cerebral. El modelo propuesto permite abordar adecuadamente la tarea de segmentación de estructuras cerebrales. Así mismo, permite aprovechar el contexto global que incorporan los módulos de autoatención logrando una segmentación más precisa y rápida. En este trabajo segmentamos 37 estructuras cerebrales y, según nuestro conocimiento, es el mayor número de estructuras bajo un enfoque 3D utilizando mecanismos de atención. (Texto tomado de la fuente) Maestría Magíster en Ingeniería - Ingeniería de Sistemas La metodología constó de 4 fases. La primera se concentró en Determinar el conjunto de imágenes de resonancia magnética que fueron parte del conjunto de datos y seleccionar el conjunto de estructuras anatómicas a segmentar. La segunda fase estuvo dirigida a Definir el conjunto de técnicas a emplear en el preprocesamiento de las imágenes de resonancia magnética definidas. La tercera fase se concentró en Diseñar la arquitectura de red neuronal para la segmentación de las estructuras anatómicas cerebrales y por último, la cuarta fase estuvo dirigida a evaluar y comparar el modelo de red neuronal implementado con aquellos existentes en el estado del arte. Visión artificial y aprendizaje automático Área Curricular de Ingeniería de Sistemas e Informática |
Databáze: | OpenAIRE |
Externí odkaz: |