Extracção de Informação de Relatórios Médicos
Autor: | Ferreira, Liliana Da Silva, Oliveira, César Telmo, Teixeira, António Joaquim Da Silva, João Paulo Cunha |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2009 |
Předmět: | |
Zdroj: | Linguamática; Vol. 1 No. 1; 89-101 Linguamática; Vol. 1 Núm. 1; 89-101 Linguamática; v. 1 n. 1; 89-101 Repositório Científico de Acesso Aberto de Portugal (Repositórios Cientìficos) Agência para a Sociedade do Conhecimento (UMIC)-FCT-Sociedade da Informação instacron:RCAAP CIÊNCIAVITAE Linguamática, Vol 1, Iss 1 (2009) |
ISSN: | 1647-0818 |
Popis: | A utilização, cada vez mais frequente nos serviços de saúde nacionais, de sistemas de Registo Clínico Electrónico tem levado a um aumento significativo da Informação disponível em formato electrónico. Embora muita desta informação exista, actualmente, numa forma estruturada, uma parte significativa encontra-se sob a forma de texto livre não estruturado. A necessidade de processar e gerir estas grandes quantidades de texto tem motivado o recente interesse em aproximações semânticas. Este artigo descreve o trabalho desenvolvido no âmbito do projecto MedAlert para a criação de um corpus anotado semanticamente e no desenvolvimento de um sistema de extracção automática de informação capaz de identificar entidades clínicas relevantes, bem como os seus relacionamentos. Para tal, o MedAlert possui actualmente um corpus de cerca de 48 000 textos médicos relativos a episódios de internamento ocorridos no Hospital Infante D. Pedro, em Aveiro. Um subconjunto do corpus foi seleccionado para a criação das directivas de anotação e anotação semântica manual e automática. O sistema de reconhecimento de entidades mencionadas REMMA foi usado numa primeira avaliação. Os primeiros resultados são apresentados indicando a necessidade de desenvolver directivas precisas para a anotação de textos médicos, de modo a melhorar a concordância entre anotadores. |
Databáze: | OpenAIRE |
Externí odkaz: |