Gender imbalance in medical imaging datasets produces biased classifiers for computer-aided diagnosis

Autor: Enzo Ferrante, Nicolás Nieto, Victoria Peterson, Diego H. Milone, Agostina J. Larrazabal
Rok vydání: 2020
Předmět:
Male
Medical Sciences
Computer science
COMPUTER-AIDED DIAGNOSIS
GENDERED INNOVATIONS
Datasets as Topic
030218 nuclear medicine & medical imaging
gender bias
purl.org/becyt/ford/1 [https]
03 medical and health sciences
Sex Factors
0302 clinical medicine
Bias
Robustness (computer science)
Medical imaging
Humans
Empirical evidence
030304 developmental biology
0303 health sciences
Multidisciplinary
Artificial neural network
DEEP LEARNING
business.industry
Applied Mathematics
Deep learning
Medical image computing
deep learning
purl.org/becyt/ford/1.2 [https]
Biological Sciences
Reference Standards
Data science
Computer-aided diagnosis
Ciencias de la Computación e Información
Physical Sciences
gendered innovations
Radiographic Image Interpretation
Computer-Assisted

computer-aided diagnosis
Female
Radiography
Thoracic

GENDER BIAS
Artificial intelligence
business
medical image analysis
Ciencias de la Información y Bioinformática
CIENCIAS NATURALES Y EXACTAS
MEDICAL IMAGE ANALYSIS
Ai systems
Zdroj: CONICET Digital (CONICET)
Consejo Nacional de Investigaciones Científicas y Técnicas
instacron:CONICET
Proceedings of the National Academy of Sciences of the United States of America
ISSN: 1091-6490
0027-8424
DOI: 10.1073/pnas.1919012117
Popis: Artificial intelligence (AI) systems for computer-aided diagnosis and image-based screening are being adopted worldwide by medical institutions. In such a context, generating fair and unbiased classifiers becomes of paramount importance. The research community of medical image computing is making great efforts in developing more accurate algorithms to assist medical doctors in the difficult task of disease diagnosis. However, little attention is paid to the way databases are collected and how this may influence the performance of AI systems. Our study sheds light on the importance of gender balance in medical imaging datasets used to train AI systems for computer-assisted diagnosis. We provide empirical evidence supported by a large-scale study, based on three deep neural network architectures and two well-known publicly available X-ray image datasets used to diagnose various thoracic diseases under different gender imbalance conditions. We found a consistent decrease in performance for underrepresented genders when a minimum balance is not fulfilled. This raises the alarm for national agencies in charge of regulating and approving computer-assisted diagnosis systems, which should include explicit gender balance and diversity recommendations. We also establish an open problem for the academic medical image computing community which needs to be addressed by novel algorithms endowed with robustness to gender imbalance. Fil: Larrazabal, Agostina Juliana. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; Argentina Fil: Nieto, Nicolás. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; Argentina Fil: Peterson, Victoria. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Matemática Aplicada del Litoral. Universidad Nacional del Litoral. Instituto de Matemática Aplicada del Litoral; Argentina Fil: Milone, Diego Humberto. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; Argentina Fil: Ferrante, Enzo. Consejo Nacional de Investigaciones Científicas y Técnicas. Centro Científico Tecnológico Conicet - Santa Fe. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional. Universidad Nacional del Litoral. Facultad de Ingeniería y Ciencias Hídricas. Instituto de Investigación en Señales, Sistemas e Inteligencia Computacional; Argentina
Databáze: OpenAIRE