A model based on genetic algorithm for feature selecion and pattern classification in medical images

Autor: Taino, Daniela Fernanda
Přispěvatelé: Universidade Estadual Paulista (Unesp), Neves, Leandro Alves [UNESP]
Jazyk: portugalština
Rok vydání: 2020
Předmět:
Zdroj: Repositório Institucional da UNESP
Universidade Estadual Paulista (UNESP)
instacron:UNESP
Popis: Submitted by Daniela Fernanda Taino (dani_taino@hotmail.com) on 2020-07-13T20:36:17Z No. of bitstreams: 1 Um modelo baseado em algoritmo genético para seleção de características e classificação de padrões em imagens médicas - Daniela F Taino.pdf: 3872023 bytes, checksum: bbdd7bdf31b0966954bde5e15c783e0e (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 - Segundo a norma ABNT NBR 10520, a epígrafe é uma citação e deve ser referenciada. 02 - A paginação deve ser sequencial, iniciando a contagem na folha de rosto e mostrando o número a partir da introdução, a ficha catalográfica ficará após a folha de rosto e não deverá ser contada. 03 – Solicitamos retirar do SUMÁRIO a indicação de Lista de Figuras, de Tabelas, Abreviaturas e siglas e Algoritmos; a segundo a norma ABNT NBR 6027 os elementos pré-textuais não devem constar no sumário. 04 – Solicitamos inserir no sumário a indicação das Referências e no texto, o correto é Referências e não Referências Bibliográficas. 05 - Solicitamos corrigir no SUMÁRIO e no texto, segundo a norma ABNT NBR 14724, os APÊNDICES são elementos pós-textuais e devem ser inseridos após as Referências e identificado por letra maiúscula sendo necessário também escrever o título. Ex: 6 Conclusão . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . .75 6.1 Contribuições obtidas . . . . . . . . . . . . . . . . . . . . . . . . . . . 76 6.2 Trabalhos futuros . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 77 Referências . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 78 APÊNDICE A - Resultados considerando variações na taxa de mutação ( ˜ m). . .90 APÊNDICE B - Valores utilizados no teste de Wilcoxon-Mann-Whitney . . . . . . . 100 06 – As páginas até 78 estão com a numeração na parte inferior e a partir da página 79 a numeração aparece na parte superior direita, as páginas devem seguir um padrão. O correto ABNT 14724 no canto superior direito da folha. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão on 2020-07-14T18:29:24Z (GMT) Submitted by Daniela Fernanda Taino (dani_taino@hotmail.com) on 2020-07-15T18:00:25Z No. of bitstreams: 1 Um modelo baseado em algoritmo genético para seleção de características e classificação de padrões em imagens médicas.pdf: 3869050 bytes, checksum: 93ee68fe42e36701c5cbdce98a445e07 (MD5) Rejected by Elza Mitiko Sato null (elzasato@ibilce.unesp.br), reason: Solicitamos que realize correções na submissão seguindo as orientações abaixo: 01 – Na ficha catalográfica solicitamos corrigir a cidade, foi selecionado Câmpus de Araraquara. 02 – Solicitamos corrigir as REFERÊNCIAS, segundo a norma ABNT NBR 6023, parágrafo 9.1 Sistema alfabético As referências devem ser reunidas no final do trabalho, em ordem alfabética de seus elementos. Sugerimos que siga as orientações do template para as correções, na página da Biblioteca, link: https://www.ibilce.unesp.br/#!/biblioteca/servicos-oferecidos/normalizacao/estrutura-do-trabalho-academico/ Lembramos que o arquivo depositado no Repositório deve ser igual ao impresso, o rigor com o padrão da Universidade se deve ao fato de que o seu trabalho passará a ser visível mundialmente. Agradecemos a compreensão on 2020-07-16T12:33:38Z (GMT) Submitted by Daniela Fernanda Taino (dani_taino@hotmail.com) on 2020-07-16T13:58:20Z No. of bitstreams: 1 Um modelo baseado em algoritmo genético para seleção de características e classificação de padrões em imagens médicas.pdf: 4014961 bytes, checksum: b388f79be9fc813e947ac9523b10da48 (MD5) Approved for entry into archive by Elza Mitiko Sato null (elzasato@ibilce.unesp.br) on 2020-07-16T19:10:06Z (GMT) No. of bitstreams: 1 taino_df_me_sjrp_par.pdf: 301258 bytes, checksum: 02932b032e3cf850c97b1e2bac670cf8 (MD5) Made available in DSpace on 2020-07-16T19:10:06Z (GMT). No. of bitstreams: 1 taino_df_me_sjrp_par.pdf: 301258 bytes, checksum: 02932b032e3cf850c97b1e2bac670cf8 (MD5) Previous issue date: 2020-07-08 A análise de imagens histológicas é baseada na avaliação visual dos tecidos por especialistas, utilizando um microscópio óptico. Essa tarefa pode ser demorada e desafiadora, principalmente devido à complexidade das estruturas e doenças sob investigação. Estes fatos motivaram o desenvolvimento de métodos computacionais para apoiar especialistas em pesquisas e tomadas de decisões. Apesar das diferentes estratégias computacionais disponíveis na literatura, as soluções baseadas em programação genética não foram totalmente exploradas para fornecer a melhor combinação de recursos, algoritmos de seleção e classificadores. Uma abordagem baseada em algoritmo genético, capaz de avaliar um número significativo de características, métodos de seleção e classificadores, é descrita para fornecer uma combinação aceitável para o diagnóstico e reconhecimento de padrões de linfomas não-Hodgkin e câncer colorretal. A estrutura cromossômica foi representada por quatro genes. A avaliação e seleção dos indivíduos, bem como os processos de cruzamento e mutação, foram definidos para distinguir os grupos investigados, com o maior valor da AUC e o menor número de características. Os testes foram realizados considerando 1.512 características de imagens histológicas, diferentes tamanhos de população, taxas de mutação e número de iteracções. Uma população inicial, de 50 indivíduos e 50 iterações, forneceu o melhor resultado para o câncer colorretal. Para os linfomas não-Hodgkin, a população inicial foi composta de 500 indivíduos e também foram necessárias 50 iterações para fornecer melhor resultado. Os valores da AUC foram de 0,984 e 0,947 para o câncer colorretal e os linfomas não-Hodgkin, respectivamente. A metodologia proposta, com informações detalhadas sobre os métodos, características e melhores combinações, é uma contribuição relevante para a comunidade interessada no estudo do reconhecimento de padrões em imagens histológicas de linfomas e câncer colorretal. The analysis of histological images is based on visual assessment of tissues by specialists using an optical microscopy. This task can be time-consuming and challenging, mainly due to the complexity of the structures and diseases under investigation. These facts have motivated the development of computational methods to support specialists in research and decision-making. Despite the different computational strategies available in the literature, the solutions based on genetic programming have not been fully explored to provide the best combination of features, selection algorithms and classifiers. An approach based on genetic algorithm able to evaluate a significant number of features, selection methods and classifiers is described in order to provide an acceptable association for the diagnosis and pattern recognition of Non-Hodgkin lymphomas and colorectal cancer. The chromosomal structure was represented with four genes. The evaluation and selection of individuals, as well as the crossover and mutation processes were defined to distinguish the groups under investigation, with the highest AUC value and the smallest number of features. The tests were performed considering 1,512 features from histological images, different population sizes, mutation rate and number of iterations. An initial population of 50 individuals and 50 iterations provided the best result for colorectal cancer. For non-Hodgkin’s lymphomas, the initial population consisted of 500 individuals and 50 iterations was also necessary to provide the best result. The AUC values were 0.984 and 0.947 for the colorectal cancer and the Non-Hodgkin lymphomas, respectively. The proposed methodology with detailed information regarding the methods, features and best combinations are relevant contributions for the community interested into the study of pattern recognition of colorectal cancer and lymphomas.
Databáze: OpenAIRE