Modelos de Aprendizado de Máquina Aplicados à Detecção de Câncer de Mama

Autor: Matheus Leão Campos, José de Deus Silva Neto, André Oliveira Carvalho Silva, Wendler Luis Nogueira Matos, Orlando Fonseca Silva
Rok vydání: 2021
Zdroj: Anais do 15. Congresso Brasileiro de Inteligência Computacional.
DOI: 10.21528/cbic2021-154
Popis: O objetivo deste trabalho é construir um algoritmo classificador binário de câncer de mama, baseado em dados de exame de sangue e fisiológicos (Idade, Índice de Massa Corporal, Glicose, Insulina, Modelo de Avaliação da Homeostase, Leptina, Adiponectina, Resistina e Proteína Quimiotática de Monócitos-1) de 116 pacientes. Para tal estudo, realizou-se comparativo de desempenho dos seguintes modelos de aprendizado de máquina: Árvore de Decisão, Floresta Aleatória, K-Vizinhos mais Próximos, Redes Neurais Artificiais, Máquinas de Vetores de Suporte e Regressão Logística. Quanto a metodologia aplicada nos dados, teve-se duas: validação cruzada por k-fold (k=10); divisão dos dados em 80% treino e 20% teste. Para a primeira, avaliou-se média da acurácia e da sensibilidade. Na segunda, valores de acurácia, sensibilidade, especificidade e área sob a curva da característica de operação do receptor. Além disso, a partir do valor-p, por correlação de Pearson e Spearman, dependendo da variável de entrada, realizou-se o teste apenas com as variáveis com nível de significância de 5%, que foram: Glicose, Insulina, Resistina e Modelo de Avaliação da Homeostase. Como melhor classificador final, teve-se a Floresta Aleatória, no método treino/teste e com 9 variáveis, com 83,3% de acurácia, 100% de sensibilidade, 64% de especificidade e 0,881 de área sob a curva.
Databáze: OpenAIRE