Extraction de citations contenues dans des documents brevet

Autor: Kogkitsidou, Eleni, Kyriacopoulou, Tita, Martineau, Claude, Martinez, Cristian, Kim, A-Young, Schoen, Antoine
Přispěvatelé: Laboratoire Techniques, Territoires et Sociétés (LATTS), Université Paris-Est Marne-la-Vallée (UPEM)-École des Ponts ParisTech (ENPC)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Informatique Gaspard-Monge (LIGM), Centre National de la Recherche Scientifique (CNRS)-Fédération de Recherche Bézout-ESIEE Paris-École des Ponts ParisTech (ENPC)-Université Paris-Est Marne-la-Vallée (UPEM), Jorge Baptista, Mario Monteleone, Université Paris-Est Marne-la-Vallée (UPEM)-École des Ponts ParisTech (ENPC)-ESIEE Paris-Fédération de Recherche Bézout-Centre National de la Recherche Scientifique (CNRS), Martineau, Claude
Jazyk: francouzština
Rok vydání: 2013
Předmět:
Zdroj: 32ème colloque international sur le lexique et la grammaire
32ème colloque international sur le lexique et la grammaire, Sep 2013, Faro, Portugal. pp.57-64
Popis: International audience; Le présent article s'inscrit dans une démarche générale d'élaboration d'outils et de méthodes d'analyse permettant de caractériser les activités scientifiques et techniques. Le nombre de publications scientifiques numériques est de plus en plus important. Nous nous intéressons plus particulièrement ici au repérage et à l'extraction automatique de citations et de références contenues dans des documents, en anglais, de type brevet d'inventions. La méthode utilisée repose sur une approche symbolique qui fait appel à la création et l'utilisation combinée de dictionnaires électroniques et de grammaires locales. L'outil de traitement de corpus Unitex est utilisé pour l'élaboration et l'application de ces ressources linguistiques à un corpus d'étude.
Databáze: OpenAIRE