Application and development of a CNN model to optimize an OligoFISSEQ image obtention pipeline

Autor: Martí Aranda, Aina
Jazyk: angličtina
Rok vydání: 2021
Předmět:
Popis: Treball de fi de grau en Bioinformàtica. Curs 2020-2021 Tutors: David Castillo Andreo i Marc A. Marti-Renom En aquest projecte s’ha explorat l’aplicació d’una intel·ligència artificial al procés d’obtenció d’imatges d’OligoFISSEQ per tal de classificar-les segons la seva qualitat. S’han desenvolupat i provat diferents processos de preparació de les imatges, arquitectura de models i augment de dades. L’estudi ha aconseguit els millors models amb errors quadràtics mitjans de 0.0149 per al model 4, 0.0131 per al model 3, 0.0109 per al model 2 i 0.0169 per al model 1, els quals utilitzats com a classificadors binaris han resultat en precisions de 0.64, 0.80, 0.88, i 0.88 a la validació externa, respectivament. En este proyecto se ha explorado la aplicación de una inteligencia artificial al proceso de obtención de imágenes de OligoFISSEQ, con tal de clasificarlas según su calidad. Se han desarrollado i probado diferentes procesos de preparación de las imágenes, arquitectura de modelos i aumento de datos. El estudio ha conseguido los mejores modelos con errores cuadráticos medianos de 0.0149 para el modelo 4, 0.0131 para el modelo 3, 0.0109 para el modelo 2 i 0.0169 para el modelo 1, los cuales utilizados como clasificadores binarios han resultado en precisiones de 0.64, 0.80, 0.88, i 0.88 en la validación externa, respectivamente. In this project we have explored the application of an artificial intelligence deep learning algorithm (DLA) in the OligoFISSEQ image acquisition protocol to classify the obtained images according to their expected quality. We developed and tested several approaches for image preprocessing, model architecture, and data augmentation. This study achieved the best regression models with mean squared errors of 0.0149 for model 4, 0.0131 for model 3, 0.0109 for model 2, and 0.0169 for model 1, which used as binary classifiers yielded accuracies of 0.64, 0.80, 0.88, and 0.88 in the external validation dataset, respectively.
Databáze: OpenAIRE