Popis: |
O Reconhecimento de Entidades Nomeadas é uma área relacionada à Extração da Informação, cujas soluções estão submetidas à área de Processamento de Linguagem Natural. As entidades são termos ou conjunto de termos que representam informações importantes para uso em diversas áreas, pois visam identificar em textos: pessoas, locais e tempo, por exemplo. Em bases criminais, indicaria quem, onde e quando um crime pode ter sido cometido. A rotulagem das entidades feita por meio de ferramentas, tais como a Google Cloud Natural Language mostrou-se inadequada para o contexto de denúncias criminais, escritas em português coloquial, contendo diversos erros tanto de ortografia como gramaticais. Assim, este trabalho apresenta uma adaptação de modelo para identificação e reconhecimento de Entidades Nomeadas baseado em Deep Learning, em textos em português (Brasil) em linguagem popular, visando a extração de informações que auxiliem a segurança pública. Os resultados indicam que a metodologia adotada é promissora, alcançando valores de 79,72%, 81,52% e 80,50% nas métricas recallmacro, precisionmacro e F1-scoremacro, respectivamente, além de apresentar novas alternativas para aperfeiçoamentos futuros. |