Requisitos para a modelagem de padrões de cunhagem e construções semi-produtivas no constructicon da FrameNet Brasil com foco no fomento ao desenvolvimento de tradutores automáticos

Autor: Tavares, Tatiane Silva
Jazyk: portugalština
Rok vydání: 2018
Předmět:
Zdroj: Repositório Institucional da UFJFUniversidade Federal de Juiz de ForaUFJF.
Druh dokumentu: Doctoral Thesis
Popis: Submitted by Geandra Rodrigues (geandrar@gmail.com) on 2018-11-01T18:58:55Z No. of bitstreams: 1 tatianesilvatavares.pdf: 3652351 bytes, checksum: ab319a3daf577b4727647589658a6657 (MD5)
Approved for entry into archive by Adriana Oliveira (adriana.oliveira@ufjf.edu.br) on 2018-11-23T11:24:07Z (GMT) No. of bitstreams: 1 tatianesilvatavares.pdf: 3652351 bytes, checksum: ab319a3daf577b4727647589658a6657 (MD5)
Made available in DSpace on 2018-11-23T11:24:07Z (GMT). No. of bitstreams: 1 tatianesilvatavares.pdf: 3652351 bytes, checksum: ab319a3daf577b4727647589658a6657 (MD5) Previous issue date: 2018-09-28
Esta pesquisa tem por objetivo investigar as contribuições que a FrameNet e o Constructicon podem oferecer aos sistemas de Tradução por Máquina (TM) ao revisitar a literatura sobre Gramática das Construções e Padrões de Cunhagem (KAY, 2013). A hipótese é a de que utilização da base de dados de uma FrameNet, que oferece representações computacionais das estruturas cognitivas essenciais na construção do sentido (os frames), e de um Constructicon, o qual integra a informação sobre a gramática de uma língua, podem auxiliar o processamento de línguas naturais pelo computador e, consequentemente, auxiliar os sistemas de Tradução por Máquina. O segundo recorte deste trabalho refere-se à revisão da Gramática das Construções, especialmente em relação ao tratamento de padrões de cunhagem. Segundo a abordagem de Kay (2005, 2013), deve-se considerar como construção apenas a quantidade mínima de informação que o falante precisa ter para que seja capaz de entender e produzir sentenças da língua. Nesta perspectiva, assume-se que as construções de uma língua sejam estes padrões mais gerais e produtivos, os quais licenciam as mais diversas sentenças compreensíveis pelo falante. Por isso buscamos reanalisar a estrutura de quantificação indefinida: i) mar de gente, ii) oceano de calúnias, iii) enxurrada de notícias, já investigada em dissertação de mestrado (TAVARES, 2014), a fim de que se possa discutir a validade da abordagem de Kay para a modelagem computacional do padrão de quantificação. A análise dos dados é guiada pelos pressupostos da Semântica de Frames (FILLLMORE, 1982,1985; PETRUCK, 1996) e pela metodologia da FrameNet, a qual emprega a análise semântica e sintática dos objetos de investigação, pois, para as tarefas de Processamento de Línguas Naturais, é necessário que se leve em conta as regularidades da língua para que esta seja processada computacionalmente. A conclusão da análise aponta para o fato de que a modelagem da estrutura de quantificação indefinida como uma rede de padrões de cunhagem no Constructicon da FrameNet Brasil, definidos a partir de restrições soft, pode trazer um ganho de generalidade na análise e a possibilidade de que estruturas inovadoras, cunhadas por analogia, sejam igualmente reconhecíveis pelo modelo computacional resultante, o que representa um avanço em relação aos processos tradicionalmente empregados na hibridização de sistemas de tradução por máquina.
This work aims to investigate the contributions that the FrameNet and the Constructicon could offer to Machine Translation (MT) systems by revisiting the literature about Construction Grammar and Coinage Patterns (KAY, 2013). The hypothesis is that by using the FrameNet database, which offers computational representations of essential cognitive structures formeaning construction (frames), and a Constructicon database, which integrates information about the grammar of a language, it is possible to support the natural language processing by the computer and, consequently, to assist Machine Translation systems. The second point of this work refers to the review of Construction Grammar, especially the treatment of coinage patterns. According to Kay’s approach (2005, 2013), it must be considered a construction only the minimal quantity of information that a speaker needs to be able to understand and to produce sentences of the language. From this perspective, it is assumed that constructions of a language are these more general and productive patterns, which license many comprehensible sentences by the speaker. For this reason we seek to reanalyze the indefinite quantity structure: i) mar de gente, ii) oceano de calúnias, iii) enxurrada de notícias, already investigated in a dissertation (TAVARES, 2014), in order to discuss the validity of Kay's approach to the computational modeling of the quantification pattern. The analyses is guided by Frame Semantics principles (FILLLMORE, 1982,1985; PETRUCK, 1996) and by FrameNet methodology, which applies a semantic and syntactic analyses to the objects of this research, because dealing with Natural Language Processing demands an account for the language regularities so it can be computationally processed. The conclusion of the analysis points to the fact that the modeling of the indefinite quantification structure as a network of coinage patterns in the FrameNet Brasil Constructicon, defined from soft constraints, can bring about a gain of generality in the analysis and the possibility that innovative structures, coined by analogy, are equally recognizable by the resulting computational model, which represents an advance over the processes traditionally employed in the hybridization of machine translation systems.
Databáze: Networked Digital Library of Theses & Dissertations