Named entity classification in the Encyclopédie ou dictionnaire raisonné des sciences et des métiers par une société de gens de lettres (1751-1772)
Autor: | Denis Vigier, Katherine McDonough, Ludovic Moncla, Alice Brenon, Thierry Joliveau |
---|---|
Přispěvatelé: | Interactions, Corpus, Apprentissages, Représentations (ICAR), École normale supérieure - Lyon (ENS Lyon)-Université Lumière - Lyon 2 (UL2)-INRP-Ecole Normale Supérieure Lettres et Sciences Humaines (ENS LSH)-Centre National de la Recherche Scientifique (CNRS), Data Mining and Machine Learning (DM2L), Laboratoire d'InfoRmatique en Image et Systèmes d'information (LIRIS), Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-Université Claude Bernard Lyon 1 (UCBL), Université de Lyon-École Centrale de Lyon (ECL), Université de Lyon-Université Lumière - Lyon 2 (UL2)-Institut National des Sciences Appliquées de Lyon (INSA Lyon), Université de Lyon-Université Lumière - Lyon 2 (UL2), The Alan Turing Institute, Environnement Ville Société (EVS), Université de Lyon-Institut National des Sciences Appliquées (INSA)-Université de Lyon-Institut National des Sciences Appliquées (INSA)-Centre National de la Recherche Scientifique (CNRS)-École nationale supérieure d'architecture de Lyon (ENSAL)-École des Mines de Saint-Étienne (Mines Saint-Étienne MSE), Institut Mines-Télécom [Paris] (IMT)-Institut Mines-Télécom [Paris] (IMT)-École Nationale des Travaux Publics de l'État (ENTPE)-Université Jean Monnet [Saint-Étienne] (UJM)-Université Jean Moulin - Lyon 3 (UJML), Université de Lyon-Université Lumière - Lyon 2 (UL2)-École normale supérieure - Lyon (ENS Lyon), Projet soutenu financièrement par la MSH Lyon-St-Etienne pour la période 2019-2020 (https://www.msh-lse.fr/projet19/geodisco) |
Jazyk: | angličtina |
Rok vydání: | 2020 |
Předmět: |
[INFO.INFO-TT]Computer Science [cs]/Document and Text Processing
lcsh:Social Sciences lcsh:H 050101 languages & linguistics [INFO.INFO-IR]Computer Science [cs]/Information Retrieval [cs.IR] 05 social sciences 0211 other engineering and technologies 0501 psychology and cognitive sciences 02 engineering and technology [SHS.LANGUE]Humanities and Social Sciences/Linguistics 021101 geological & geomatics engineering |
Zdroj: | SHS Web of Conferences, Vol 78, p 11008 (2020) 7ème Congrès Mondial de Linguistique Française 7ème Congrès Mondial de Linguistique Française, Jul 2020, Montpellier, France |
ISSN: | 2261-2424 |
Popis: | International audience; We present a method for improving rule- based named entity recognition for Diderot and d’Alembert’s Encyclopédie. We use PERDIDO, a semantic annotation tool initially developed for the annotation of geographic information and the reconstruction of itineraries. We improve PERDIDO’s recognition of named entities by implementing new rules developed from an a exploratory and statistical analysis of word co-occurrences for proper nouns in the Encyclopédie corpus.; Nous présentons la méthode que nous avons suivie pour améliorer notre annotation automatique des entités nommées dans l’Encyclopédie de Diderot et d’Alembert. L’outil d’annotation sémantique PERDIDO que nous utilisons a été initialement développé pour l’annotation d’informations géographiques et la reconstruction d’itinéraire. Nous proposons d’y implémenter de nouvelles règles élaborées manuellement à partir d’une étude des cotextes co-occurrentiels des noms propres du corpus accomplie au moyen d’une plateforme automatique d’exploration et de calcul. |
Databáze: | OpenAIRE |
Externí odkaz: |