Conhecimento sintatico-semantico e processamento de sentenças em rede neural recorrente simples
Autor: | Garcia, Ricardo Basso |
---|---|
Jazyk: | portugalština |
Rok vydání: | 2006 |
Předmět: | |
Zdroj: | Repositório Institucional da UnicampUniversidade Estadual de CampinasUNICAMP. |
Druh dokumentu: | masterThesis |
Popis: | Orientador: Edson Françozo Dissertação (mestrado) - Universidade Estadual de Campinas, Instituto de Estudos da Linguagem Made available in DSpace on 2018-08-07T04:10:15Z (GMT). No. of bitstreams: 1 Garcia_RicardoBasso_M.pdf: 578837 bytes, checksum: c5ae075736e4e6e2077a3d8f82d9be89 (MD5) Previous issue date: 2006 Esta dissertação começa com uma reflexão sobre o caráter interdisciplinar da psicolingüística, que é tomada como o campo de pesquisa que investiga, entre outros, os processos cognitivos subjacentes ao comportamento lingüístico. Essa investigação emprega diferentes métodos e técnicas, dada a complexidade do estudo de processos que são internos ao organismo e, portanto, não diretamente observáveis. Nesse quadro, introduzimos a metodologia adotada nesta dissertação - a modelagem. O uso de modelos é tratado em termos gerais, para então ser apresentado no contexto do estudo dos processos cognitivos. Neste ponto, é crucial notar que modelar esses processos implica em fazer suposições sobre como eles são. A hipótese geral que fundamenta os modelos de nosso interesse é a de que cognição é computação, ou seja, processos cognitivos são computacionais. Essa hipótese deu origem a dois paradigmas de modelagem distintos - um baseado nos fundamentos da computação digital e outro nos princípios da neurocomputação. Este segundo é apresentado em detalhes, depois de uma exposição das principais diferenças entre esses paradigmas. Estabelecidas as bases teórico-metodológicas dessa abordagem, replicamos o experimento de Elman (1990) em que uma rede neural recorrente simples é treinada para processar palavras dispostas em seqüências que compõem sentenças simples. É interessante notar que essa disposição reflete informações gramaticais, que podem ser descritas em tennos sintáticos (como sujeito, verbo e objeto) e semânticos (como agente, paciente e tema). Nosso intuito foi investigar se e como informações desse tipo são aprendidas pelo sistema. A análise dessa rede mostrou que seu processamento opera principalmente por distinções lexicais, isto é, não há o uso efetivo de informações lingüísticas do nível de sentenças. O passo seguinte foi modificar esse experimento - treinamos a rede com o mesmo conjunto de sentenças, desta vez marcando a fronteira entre elas. A análise dessa rede mostrou que, nesse novo experimento, o processamento opera principalmente por distinções sintáticas, havendo também a presença de distinções semânticas de papel temático. A partir desses resultados, elaboramos um novo experimento - treinamos uma rede com um conjunto de sentenças nas quais a disposição das palavras reflete principalmente informações semânticas de papel temático, havendo também a presença de informações sintáticas e da fronteira entre as sentenças. O objetivo foi controlar a informação lingüística presente nas sentenças, de modo a permitir maior confiabilidade nos resultados. A análise dessa rede mostrou-se coerente com a do experimento anterior, ou seja, o processamento está, de fato, operando segundo conhecimentos sintático-semânticos do nível de sentenças. A consistência dos resultados obtidos permite afirmar, com um grau de confiabilidade satisfatório, que há a presença de conhecimento sintático-semântico, durante o processamento de sentenças, ao mesmo tempo em que mostra como essas informações estão presentes. Esses resultados são importantes porque estendem a já conhecida capacidade da rede recorrente simples em codificar informação sintática, mostrando também sua capacidade em captar informação semântica This dissertation begins with a retlection about the interdisciplinary roots of psycholinguistics, which is taken as the research field concemed with the investigation of the cognitive processes subjacent to the verbal behavior. This investigation employs different methods and techniques, given the complexity inherent to the study of processes that take place inside the organism, and therefore are not directly observable. In view of this, we introduce the methodology adopted in this dissertation - modeling. The usage of models is initially dealt with in general terms, and then is analysed in the context of the study of cognitive processes. At this point, it is crucial to notice that modeling such processes implies making assumptions about how they are. The general hypothesis underlying the models we are interested in is that cognition is computation, that is, cognitive processes are computational. This hypothesis has given birth to two different paradigms of modeling - one based on the fundamentals of digital computing, and other based on the principIes of neurocomputing. Afier a brief discussion of their main differences, the later is presented in details. Once the theoretical-methodological basis of the neurocomputing framework is established, we replicate Elman's (1990) experiment in which a simple recurrent neural network is trained to process words in sequences, forming simple sentences. It should be noted that the sequences reflect grammatical information that can be described in syntactic (subjects, verbs and objects) and semantic (agents, patients and themes) terms. Our intent was to investigate whether and how such information is leamed by the system. Analyses of this experiment have shown that the processing is guided by lexical information, that is, linguistic information at the sentence leveI is not used. In the next step we have modified this experiment by training the network with the saroe set of sentences, just introducing an end-of-period mark between them. The analyses have shown that, in this new experiment, the processing is guided by both syntactic and semantic information, such as thematic roles. Taking these results as starting point, we devised a new experiment - a similar network was trained with a set of sentences in which word sequences were main1y led by semantic information like thematic role; the end-of-period mark between sentences was used. The intent was to controllinguistic information so as to increase our confidence in the results. Results consistent with the fonner experiments were obtained, that is, the processing is indeed guided by both syntactic and semantic infonnation at the sentence level. The consistency of the results achieved a1lows us to state that there are both syntactic and semantic knowledge operating during sentence processing. This result is important because it extends the already known simple recurrent network ability in coding syntactic information, showing that SRNs also are capable of handling semantic infonnation like thematic roles Mestrado Mestre em Linguística |
Databáze: | Networked Digital Library of Theses & Dissertations |
Externí odkaz: |