Segmentation and classification of tumor cells in breast cancer histological images: analysis of multicenter variability

Autor: Rosell Murillo, Marina
Přispěvatelé: Universitat Politècnica de Catalunya. Departament de Teoria del Senyal i Comunicacions, Marques Acosta, Ferran, Pardàs Feliu, Montse
Jazyk: angličtina
Rok vydání: 2022
Předmět:
Popis: Als hospitals Vall d'Hebron i Bellvitge s'utilitzen dues marques diferents de tinció de cèl·lules HER2 per diagnosticar pacients amb càncer de mama HER2 positiu, que presenten variacions de color. Disposem d'un conjunt de dades etiquetades de Vall d'Hebron que ha permès a l'equip de recerca entrenar un model de segmentació múltiple per fer prediccions, i un conjunt de dades d'imatges de Bellvitge amb només un subconjunt d'etiquetes. Aquest projecte pretén transferir el coneixement que la xarxa ha après amb imatges de Vall d'Hebron per poder obtenir prediccions d'alta qualitat amb imatges de Bellvitge mitjançant fine-tuning del model. A través de diferents experiments, s'estudien tres variables: el nombre mínim d'imatges etiquetades necessàries del nou centre, l'impacte que té la distribució de les classes del conjunt de dades d'entrenament a la fase de fine-tuning i la possibilitat d'obtenir un model capaç de predir imatges d'ambdós centres barrejant les seves dades en la fase de fine-tuning. Addicionalment, s'han explorat algunes tècniques per superar les conseqüències que comporta tenir un conjunt de dades desequilibrat a l'hora d'entrenar el model. In Vall d'Hebron and Bellvitge hospitals, two different HER2 cell staining brands are used to diagnose HER2-positive breast cancer patients, which present color variations. We dispose of a labeled dataset from Vall d'Hebron that allowed the research team to train a multi-segmentation model to make predictions, and a dataset of Bellvitge's images with only a subset of ground truth labels. This project aims to infer the knowledge that the network has gained training with Vall d'Hebron images to make it able to obtain high-quality predictions with Bellvitge images using transfer learning by fine-tuning the model. Three variables are studied through different experiments: the minimum number of labeled images needed from the new center, the impact that the distribution of the classes of the fine-tuning training dataset has, and the possibility of obtaining a model able to predict images from both centers by mixing their data in the fine-tuning phase. Additionally, a few techniques have been explored to overcome the consequences that having an unbalanced dataset entails when training the model.
Databáze: OpenAIRE