Compilation of a Property Grammar for Syntactic Parsing through Constraint Optimisation

Autor: Jean-Philippe Prost, Remi Coletta, Christophe Lecoutre
Přispěvatelé: Exploration et exploitation de données textuelles (TEXTE), Laboratoire d'Informatique de Robotique et de Microélectronique de Montpellier (LIRMM), Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM)-Centre National de la Recherche Scientifique (CNRS)-Université de Montpellier (UM), Agents, Apprentissage, Contraintes (COCONUT), Centre de Recherche en Informatique de Lens (CRIL), Université d'Artois (UA)-Centre National de la Recherche Scientifique (CNRS), Centre National de la Recherche Scientifique (CNRS)-Université d'Artois (UA)
Jazyk: francouzština
Rok vydání: 2016
Předmět:
Zdroj: 23e Conférence sur le Traitement Automatique des Langues Naturelles
TALN: Traitement Automatique des Langues Naturelles
TALN: Traitement Automatique des Langues Naturelles, Jul 2016, Paris, France
HAL
Popis: International audience; This paper introduces the compilation process of a property grammar into a constraint in extenso. The process is part of a robust syntactic parser implemented as the resolution of a Constraint Optimisation Problem. The compiled grammar enumerates all the unique immediate constituents in the search space. The interest of this preliminary work stands in the exploration of a Model-Theoretic computational modelling of language, which integrates the representation of both canonical and non-canonical utterances. The objective of this work is more particularly to explore the possibility to build the set of all candidate models from a set of phrasal structures observed on corpus. The paper also discusses the potential integration of probabilistic predictions within an exact reasoning process, in order to discriminate the grammatical parses from the ungrammatical ones.; Cet article présente un processus de compilation d’une grammaire de propriétés en une contrainte en extension. Le processus s’insère dans le cadre d’un analyseur syntaxique robuste par résolution d’un problème d’optimisation de contraintes. La grammaire compilée est une énumération de tous les constituants immédiats uniques de l’espace de recherche. L’intérêt de ce travail encore préliminaire tient principalement dans l’exploration d’une modélisation computationnelle de la langue à base de Syntaxe par Modèles (MTS, Model-Theoretic Syntax), qui intègre la représentation indifférenciée des énoncés canoniques et non-canoniques. L’objectif plus particulier du travail présenté ici est d’explorer la possibilité de construire l’ensemble des structures candidat-modèles à partir de l’ensemble des structures syntagmatiques observées sur corpus. Cet article discute notamment le potentiel en matière d’intégration de prédictions probabilistes dans un raisonnement exact pour contribuer à la discrimination entre analyses grammaticales et agrammaticales.
Databáze: OpenAIRE