Erkennung von Hirntumoren in MRI-Bildern mit Transfer Lernen von vor-trainierten CNN-Modellen

Autor: Goodarzi, Samereh
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Popis: Eine der beliebtesten nicht-invasiven Bildgebungsmethoden zur Erkennung von Hirntumoren ist die Magnetresonanztomographie (MRI). Die manuelle Klassifizierung von normalen und tumorhaltigen MRI-Aufnahmen des Gehirns ist sehr zeit- und ressourcenaufwändig. Daher wurden computergestützte Tumorerkennungssysteme unter Verwendung von convolutional neural nets (CNN) als alternative Methode eingeführt, die erhebliche Fortschritte im Bereich des maschinellen Lernens vorzuweisen hat. Ein zuverlässiges Training eines CNN erfordert einen großen Datensatz, was ein erhebliches Problem darstellen kann, wenn die Daten rar oder, aufgrund von Datenschutz der Patienten, schwierig zu sammeln und zu identifizieren sind. Unter diesen Umständen kann Transfer-Lernen für verbesserte Ergebnisse eingesetzt werden. Transfer-Lernen ist eine Technik des Deep Learning, bei den Modellen, die bereits auf einem großen Benchmark-Datensatz trainiert wurden, als Basis für die Layer des CNN verwendet werden, anstatt das Netzwerk von Grund auf neu aufzubauen. Ziel dieser Arbeit ist es, zu zeigen, wie Transfer-Lernen in einem CNN zur Tumorerkennung in MRI-Bildern des Gehirns mit einem sehr kleinen Bilddatensatz angewendet werden kann. In der ersten Stufe wird ein CNN von Grund auf für ein binäres Klassifikationsproblem der Hirntumorerkennung aufgebaut. Danach wird das Modell durch Methoden zur Datenerweiterung, Regularisierung und Reduzierung der verborgenen Schichten verbessert. Im nächsten Schritt werden drei Architekturen von CNN (VGG16, VGG19 und ResNet50) als Layer für den Wiederaufbau des Netzes mit einem Transfer-Learning-Ansatz implementiert. Alle drei Modelle stammen aus der "Keras"-Bibliothek, die bereits auf dem riesigen "ImageNet"-Datensatz mit 1,2 Millionen Bildern und 1000 Kategorien trainiert wurden. Die beiden früheren Modelle von Grund auf sowie die drei späteren Modelle mit Transfer-Learning-Implementierung werden unter Verwendung derselben Hyperparameter wie "BinaryCrossentropy()" für die Verlustfunktion, "Adam" aus Keras als Optimierer, "Accuracy()" aus Keras als Metrik und die Lernrate von 0,0001, die bei Bedarf mit der Funktion "ReduceLROnPlateau" auf den Mindestwert von 0,000001 reduziert wird, kompiliert. Schließlich werden die Modelle auf einem kleinen Daten-satz von Kaggle, der 253 MRI-Bilder des Gehirns mit und ohne Tumoren enthält, für 50 Epochen mit einer Stapelgröße von 8 trainiert und die Kontrollpunkte werden für weitere Analysen gespeichert. Als Ergebnis zeigen wir, dass selbst wenn Methoden zur Datenerweiterung verwendet werden, um größere Datenmengen zu erzeugen, es nicht ratsam ist, ein CNN von Grund auf neu zu erstellen, wenn nur ein kleiner Datensatz zur Verfügung steht, und, dass damit keine akzeptablen oder vertrauenswürdigen Ergebnisse erzielt werden können. Darüber hinaus zeigen wir, dass das VGG16-basierte Modell die VGG19- und ResNet50-basierten Modelle für 50 Epochen übertrifft. Dies geht aus einer Gesamtuntersuchung der Genauigkeit und der Ergebnisse der Konfusionsmatrix für drei auf Transferlernen basierende CNN hervor. One of the popular non-invasive imaging methods used to identify brain tumors is magnetic resonance imaging (MRI). Manual classification of normal and tumor-containing brain MRIs takes lots of time and resources. Hence, computer-aided tumor detection systems using convolutional neural networks have been recently intro-duced as an alternative method which has made significant advancements in machine learning and offered success stories. Reliable training of a convolutional neural network requires a large dataset which can be a considerable problem where the data is uncommon or expensive to gather and identify due to patient privacy concerns. In these circumstances transfer learning can be employed for successful performance. Transfer learning is the step in deep learning where models that have already been trained on a sizable benchmark dataset are used as the base convolutional layers, rather than building the network from scratch. The aim of this thesis is to show how transfer learning can be applied in a convolutional neural network for tumor detection in brain MRI images with a very small image dataset. In the first level, a convo-lutional neural network is built from scratch for a binary classification problem of brain tumor detection. Then, the model is enhanced using data augmentation methods, regulariza-tion, and hidden layers reduction. In the next step, three architectures of convolutional neural networks (VGG16, VGG19, and ResNet50) are implemented as based layers for rebuilding the network with transfer learning approach. All three models come from the “Keras” library which have already been trained on “ImageNet” huge dataset containing 1.2 million images with 1000 categories. The two former models from scratch as well as the three later ones with transfer learning implementation are compiled applying same hyperparameters such as "BinaryCrossentropy()" for the loss function, "Adam" from Keras as the optimizer, "Accuracy()" from Keras as the metrics, and the learning rate of 0.0001 which goes through a reduction down to the minimum value of 0.000001 using "ReduceLROnPlateau" function a long with epochs if needed. In the end, the models are trained on a small dataset from Kaggle contain-ing 253 brain MRI images with and without tumors for 50 epochs with the batch size of 8 and the control points are stored for further analysis. The results demonstrate that even if ethods for data augmentation are used to generate larger amounts of data, establishing a CNN model from scratch, in the case of small dataset available, is not advisable at all and will not produce acceptable or trustworthy results. Furthermore, we show that the VGG16-based model outperforms the VGG19 and ResNet50-based models for 50 epochs, according to an overall examination of accuracy and confusion matrix findings for three transfer learning-based deep convolutional neural network models.
Databáze: OpenAIRE