Transcrição e anotação de dados linguísticos usando as ferramentas ELAN e LancsBox

Autor: Marta Deysiane Alves Faria Sousa, Victor Renê Andrade Souza
Jazyk: English<br />Spanish; Castilian<br />Portuguese
Rok vydání: 2022
Předmět:
Zdroj: Domínios de Lingu@gem, Vol 16, Iss 3, Pp 1173-1202 (2022)
Druh dokumentu: article
ISSN: 1980-5799
DOI: 10.14393/DL51-v16n3a2022-10
Popis: Objetiva-se com este trabalho demonstrar como as ferramentas de transcrição de dados ELAN 5.9 (2020) e de análise de corpora LancsBox 5.1.2 (BREZINA; WEILL-TESSIER; MCENERY, 2020) têm contribuído para a transcrição de entrevistas sociolinguísticas realizadas no escopo do Grupo de Estudos em Linguagem, Interação e Sociedade (GELINS) da Universidade Federal de Sergipe, bem como para extração automatizada de fenômenos linguísticos variáveis. Para tanto, apresenta-se as normas pelas quais as entrevistas são transcritas, formas de utilizar o ELAN 5.9 (2020) para transcrição, e por fim, a maneira de fazer a etiquetagem morfológica dos dados e buscas por fenômenos variáveis nos dados de fala utilizando-se a ferramenta LancsBox 5.1.2 (BREZINA; WEILL-TESSIER; MCENERY, 2020). As duas ferramentas têm se mostrado eficientes para uma transcrição alinhada com áudio, para anotação morfológica e buscas automáticas em grandes volumes de textos orais. Este texto contribui para exploração de ferramentas que permitam uma transcrição mais rápida e acurada de dados orais bem como buscas mais automatizadas de grandes volumes de dados.
Databáze: Directory of Open Access Journals