Terminology and computational linguistics: new praxes in terminography

Autor: Barcellos Almeida, Gladis Maria De, Mendonça De Oliveira, Leandro Henrique
Jazyk: angličtina
Rok vydání: 2012
Předmět:
DOI: 10.15122/isbn.978-2-8124-4148-6.p.0139
Popis: Les activités terminographiques qui se sont développées au Brésil ont très fortement bénéficié des avancées obtenues en Linguistique Informatisée et Linguistique de Corpus, ainsi que du développement des outils informatiques pour le traitement du portugais. Dans ce contexte, la terminologie descriptive à base linguistique connaît un essor remarquable dans le pays, grâce à la possibilité de travailler avec des grands corpus permettant l’observation et la description systématique des phénomènes linguistiques récurrents, ce qui était impossible auparavant. Pour donner des exemples des nouvelles pratiques terminographiques en cours au Brésil, nous avons choisi le travail développé par le Groupe d’études et de recherches en terminologie de l’UFSC (GETerm), qui développe des produits terminologiques depuis 1999. Ainsi, nous présentons la méthodologie de travail couvrant les différentes étapes de l’activité terminographique du GETerm, focalisant notre attention sur l’environnement informatique dénommé e-Termos, développé par les chercheurs de ce groupe. Cet environnement rassemble une panoplie d’outils linguistiques interactifs dans une structure modulaire vouée aux activités terminographiques telles que la gestion des corpus, l’extraction semi-automatique des termes, l’élaboration et l’éditon de fiches terminologiques, le dessin de l’architecture et l’organisation des cartes conceptuelles (les ontologies), la rédaction de la définition terminologique, l’édition et la diffusion des articles.
Term management in Brazil has been greatly facilitated over the past fifteen years thanks to progress made in computer and corpus linguistics, in particular the development of IT tools for processing Portuguese. This environment has contributed to the remarkable development of descriptive terminology based on actual linguistic description, exploiting the new possibilities previously unattainable opened up by access to large-scale corpora which enable the linguist to observe and describe recurrent linguistic phenomena systematically. To exemplify the new term management practices being developed in Brazil today, this article presents the current program of the Group for studies and research in terminology of the Federal University of São Carlos (GETerm), which has been developing computer-based tools since 1999. The methodology of the work corresponding to the various stages in terminology management is presented, focusing on the IT environment known as e-Termos, developed in-house. This environment brings together a set of collaborative linguistic tools linked to a modular structure dedicated to terminological activities such as corpus management, semi-automatic term extraction, preparing and publishing term records, drawing the architecture and organisation of conceptual charts (ontologies), writing definitions of terms, publishing and disseminating articles. Há mais ou menos uma década, observa-se a direta interferência, nas atividades terminográficas desenvolvidas no Brasil, dos avanços em Linguística Computacional, Linguística de Corpus e o desenvolvimento de ferramentas computacionais voltadas para o processamento do português. Nesse sentido, a terminologia descritiva de base linguística passa a ter um amplo desenvolvimento, já que a possibilidade de lidar com grandes corpora permite a observação e descrição de fenômenos linguísticos recorrentes antes impossível de perceber. Para tratar das novas práticas em terminografia, elegeu-se como cenário o Grupo de Estudos e Pesquisas em Terminologia (GETerm) que, desde 1999, desenvolve produtos terminológicos. Assim, pretende-se apresentar a metodologia de trabalho envolvida nas diversas fases da atividade terminográfica, dando relevo ao ambiente computacional denominado e-Termos, elaborado por nossa equipe de pesquisa, o qual reúne um conjunto de ferramentas linguísticas e colaborativas interligadas a uma estrutura modular dedicada às atividades terminográficas, tais como gerenciamento de corpora, extração semiautomática de termos, elaboração e edição de fichas terminológicas, arquitetura e preenchimento de mapas conceituais (ontologias), redação da definição terminológica, edição e difusão de verbetes.
Databáze: OpenAIRE