Errors lingüístics en el domini biomèdic: Cap a una tipologia d’errors per a l’espanyol
Autor: | López Hernández, Jésica, Almela, Ángela, Valencia-García, Rafael |
---|---|
Jazyk: | Catalan; Valencian |
Rok vydání: | 2021 |
Předmět: |
natural language processing
Candidate error Detecció automàtica d’errors Natural language processing P201-299 automatic error detection Corpus biomèdic biomedical corpus Comparative grammar candidate error Semantics Error candidat Automatic error detection error patterns Biomedical corpus P325-325.5 Error patterns Processament del llenguatge natural Patrons d’error |
Zdroj: | Sintagma, Vol 33, Pp 83-100 (2021) Repositorio Abierto de la UdL Universitad de Lleida |
ISSN: | 2013-6455 0214-9141 |
Popis: | L’objectiu d’aquest treball és l’anàlisi d’errors continguts en un corpus d’informes mèdics en llenguatge natural i el disseny d’una tipologia d’errors, ja que no hi va haver una revisió sistemàtica sobre verificació i correcció d’errors en documentació clínica en castellà. En el desenvolupament de sistemes automàtics de detecció i correcció, és d’interès aprofundir en la naturalesa dels errors lingüístics que es produeixen en els informes clínics per tal de detectar-los i tractar-los adequadament. Els resultats mostren que els errors d’omissió són els més freqüents en la mostra analitzada i que la longitud de la paraula sens dubte influeix en la freqüència d’error. La tipificació dels patrons d’error proporcionats permet el desenvolupament d’un mòdul basat en coneixements lingüístics, actualment en curs, que serà capaç de millorar el rendiment dels sistemes de correcció de detecció i correcció d’errors per al domini biomèdic The objective of this work is the analysis of errors contained in a corpus of medical reports in natural language and the design of a typology of errors, as there was no systematic review on verification and correction of errors in clinical documentation in Spanish. In the development of automatic detection and correction systems, it is of great interest to delve into the nature of the linguistic errors that occur in clinical reports, in order to detect and treat them properly. The results show that omission errors are the most frequent ones in the analyzed sample, and that word length certainly influences error frequency. The typification of error patterns provided is enabling the development of a module based on linguistic knowledge, which is currently in progress. This will help to improve the performance of error detection and correction systems for the biomedical domain. This work was supported by the Spanish National Research Agency (AEI) through project LaTe4PSP (PID2019-107652RB-I00/AEI/10.13039/501100011033). Furthermore, the main autor is supported by Ministerio de Universidades of Spain through the national program Ayudas para la formación de profesorado universitario (FPU), with reference FPU16/03324 |
Databáze: | OpenAIRE |
Externí odkaz: |