Named entity classification in the Encyclopédie ou dictionnaire raisonné des sciences et des métiers par une société de gens de lettres (1751-1772)

Autor: Denis Vigier, Katherine McDonough, Ludovic Moncla, Alice Brenon, Thierry Joliveau
Přispěvatelé: Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Data Mining and Machine Learning (DM2L), Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Université Lumière - Lyon 2 (UL2), The Alan Turing Institute, Environnement Ville Société (EVS), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École nationale supérieure d'architecture de Lyon (ENSAL)-École des Mines de Saint-Étienne (Mines Saint-Étienne MSE), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-École Nationale des Travaux Publics de l'État (ENTPE)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université Lumière - Lyon 2 (UL2)-École normale supérieure - Lyon (ENS Lyon), Projet soutenu financièrement par la MSH Lyon-St-Etienne pour la période 2019-2020 (https://www.msh-lse.fr/projet19/geodisco)
Jazyk: angličtina
Rok vydání: 2020
Předmět:
Zdroj: SHS Web of Conferences, Vol 78, p 11008 (2020)
7ème Congrès Mondial de Linguistique Française
7ème Congrès Mondial de Linguistique Française, Jul 2020, Montpellier, France
ISSN: 2261-2424
Popis: International audience; We present a method for improving rule- based named entity recognition for Diderot and d’Alembert’s Encyclopédie. We use PERDIDO, a semantic annotation tool initially developed for the annotation of geographic information and the reconstruction of itineraries. We improve PERDIDO’s recognition of named entities by implementing new rules developed from an a exploratory and statistical analysis of word co-occurrences for proper nouns in the Encyclopédie corpus.; Nous présentons la méthode que nous avons suivie pour améliorer notre annotation automatique des entités nommées dans l’Encyclopédie de Diderot et d’Alembert. L’outil d’annotation sémantique PERDIDO que nous utilisons a été initialement développé pour l’annotation d’informations géographiques et la reconstruction d’itinéraire. Nous proposons d’y implémenter de nouvelles règles élaborées manuellement à partir d’une étude des cotextes co-occurrentiels des noms propres du corpus accomplie au moyen d’une plateforme automatique d’exploration et de calcul.
Databáze: OpenAIRE