Modelos de Aprendizado de Máquina Aplicados à Detecção de Câncer de Mama

Autor:	Matheus Leão Campos, José de Deus Silva Neto, André Oliveira Carvalho Silva, Wendler Luis Nogueira Matos, Orlando Fonseca Silva
Rok vydání:	2021
Zdroj:	Anais do 15. Congresso Brasileiro de Inteligência Computacional.
DOI:	10.21528/cbic2021-154
Popis:	O objetivo deste trabalho é construir um algoritmo classificador binário de câncer de mama, baseado em dados de exame de sangue e fisiológicos (Idade, Índice de Massa Corporal, Glicose, Insulina, Modelo de Avaliação da Homeostase, Leptina, Adiponectina, Resistina e Proteína Quimiotática de Monócitos-1) de 116 pacientes. Para tal estudo, realizou-se comparativo de desempenho dos seguintes modelos de aprendizado de máquina: Árvore de Decisão, Floresta Aleatória, K-Vizinhos mais Próximos, Redes Neurais Artificiais, Máquinas de Vetores de Suporte e Regressão Logística. Quanto a metodologia aplicada nos dados, teve-se duas: validação cruzada por k-fold (k=10); divisão dos dados em 80% treino e 20% teste. Para a primeira, avaliou-se média da acurácia e da sensibilidade. Na segunda, valores de acurácia, sensibilidade, especificidade e área sob a curva da característica de operação do receptor. Além disso, a partir do valor-p, por correlação de Pearson e Spearman, dependendo da variável de entrada, realizou-se o teste apenas com as variáveis com nível de significância de 5%, que foram: Glicose, Insulina, Resistina e Modelo de Avaliação da Homeostase. Como melhor classificador final, teve-se a Floresta Aleatória, no método treino/teste e com 9 variáveis, com 83,3% de acurácia, 100% de sensibilidade, 64% de especificidade e 0,881 de área sob a curva.
Databáze:	OpenAIRE
Externí odkaz:	https://explore.openaire.eu/search/publication?articleId=doi_________::670af21371fce0c7bb22c8204c4b5141 https://doi.org/10.21528/cbic2021-154 Zobrazit plný text záznamu