VaLexPB: um léxico de valências e diáteses verbais para o português brasileiro baseado no formalismo LFG-XLE
Autor: | Mourão, Jessé de Sousa |
---|---|
Přispěvatelé: | Araripe, Leonel Figueiredo de Alencar |
Jazyk: | portugalština |
Rok vydání: | 2021 |
Předmět: | |
Zdroj: | Repositório Institucional da Universidade Federal do Ceará (UFC) Universidade Federal do Ceará (UFC) instacron:UFC |
Popis: | This dissertation presents a research work whose main objective was the construction of a computational lexicon of verbal valences and diatheses of Brazilian Portuguese (BP), named VaLexPB, via the LFG-XLE formalism. The work was initially motivated by theoretical, descriptive and applied scarcity and gaps, identified in the linguistic literature and in technical and technological knowledge for the computational processing of Brazilian Portuguese. Particularly, the research aimed at contributing to the development of a lexical-functional computational grammar for BP. To this end, a set of valences in the form of verbal diathesis, based on the Dicionário de Valências Verbais do Português Brasileiro (Perini, 2015), was elaborated and implemented in the LFG-XLE formalism. The theoretical model adopted for the description and analysis was the Lexical-Functional Grammar along with theoretical proposals by Perini (2015, 2019), Cançado (2005) and Cançado and Amaral (2016). The methodological approach used was the one already consolidated in works of computational LFG-XLE grammars construction. One of the goals was also to evaluate the resource regarding its ability to cover BP sentences with the investigated verbs, besides the analysis of the computational and theoretical consequences of the implemented resource. As a result, a set of 389 verbal diatheses was developed, covering sentential constructions licensed by at least 409 verbs of BP. These diatheses allow the analysis of sentences at three levels: two levels of syntactic representation (c-structure and f-structure) and one level of semantic representation (a-structure). Regarding the coverage capacity of VaLexPB, tests showed that it managed to cover over 90% of new sentences licensed by the implemented verbs. The results also showed that this resource has a significant degree of ambiguity, producing an average of 2.8 to 3.7 solutions per sentence (considering development and coverage tests), something that still needs to be worked on in future work in order to include restrictions that might reduce this ambiguity. Despite the improvements needed, the developed resource presents great relevance and usefulness, as it contributes, in the theoretical side, to the current knowledge about the nature and functioning of the BP verbal lexicon; and fro the practical side, it extends a BP computational LFG grammar, enriching the computational processing scenario of this language. Esta tese apresenta uma pesquisa que teve como principal objetivo a construção de um léxico computacional de valências e diáteses verbais do Português Brasileiro (PB), denominado VaLexPB, via formalismo LFG-XLE. O trabalho foi motivado inicialmente em carências e lacunas de ordem tanto teórica quanto descritiva e aplicada, identificadas na literatura linguística e no conhecimento técnico e tecnológico produzido para fins de tratamento e processamento computacional do Português Brasileiro. Particularmente, a pesquisa visou contribuir com o desenvolvimento de uma gramática computacional léxico-funcional para o PB. Para tanto, um conjunto de valências dadas em formas de diáteses verbais, baseado no Dicionário de Valências Verbais do Português Brasileiro (Perini, 2019), foi elaborado e implementado no formalismo LFG-XLE. O modelo teórico adotado para dar suporte à descrição e análise foi o da Gramática Léxico-Funcional juntamente com propostas teóricas desenvolvidas por Perini (2015, 2019) e Cançado e Amaral (2017). A abordagem metodológica empregada foi a já consolidada nos trabalhos de construção de gramáticas computacionais no formalismo LFG-XE. Objetivou-se ainda a avaliação do recurso quanto à sua capacidade de cobertura de sentenças do PB com os verbos investigados e a análise das consequências computacionais e teóricas do recurso implementado. Como resultado, chegou-se a um conjunto de 389 diáteses verbais que abrangem as construções sentenciais licenciadas por pelo menos 409 verbos do PB. Essas diáteses permitem a análise de sentenças em três níveis: dois níveis de representação sintática (estrutura-c e estruturua-f) e um nível de representação semântica (estrutura-a). Em relação à capacidade cobertura do VaLexPB, os testes mostraram que ele conseguiu cobrir pouco mais de 90% de sentenças novas licenciadas pelos verbos implementados. Os resultados também mostraram que o recurso tem um grau significativo de ambiguidade, produzindo uma média de 2,8 a 3,7 soluções por sentença (considerando os testes de desenvolvimento e de cobertura), algo que ainda precisa ser trabalhado em trabalhos futuros, de modo a incluir restrições que reduzam essa ambiguidade. Apesar dos aprimoramentos ainda necessários, o recurso desenvolvido tem grande relevância e utilidade, pois contribui, no âmbito teórico, com o conhecimento que se tem sobre a natureza e funcionamento do léxico verbal no PB; e no âmbito prático, amplia uma gramática computacional LFG para o PB, enriquecendo o cenário de processamento computacional dessa língua. |
Databáze: | OpenAIRE |
Externí odkaz: |