Modèles de langue pour la mise à jour d'un profil d'entité

Autor: Rafik Abbes, Karen Pinel-Sauvagnat, Nathalie Jane Hernandez, Mohand Boughanem
Přispěvatelé: Systèmes d’Informations Généralisées (IRIT-SIG), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, MEthodes et ingénierie des Langues, des Ontologies et du DIscours (IRIT-MELODI), Université Toulouse - Jean Jaurès (UT2J), Université Toulouse III - Paul Sabatier (UT3), ARIA : Association francophone de Recherche d’Information et Applications, Grélaud, Françoise
Předmět:
Zdroj: HAL
Conférence francophone en Recherche d'Information et Applications (CORIA 2014)
Conférence francophone en Recherche d'Information et Applications (CORIA 2014), ARIA : Association francophone de Recherche d’Information et Applications, Mar 2014, Nancy, France. pp.129--143
Popis: RÉSUMÉ. Dans cet article nous souhaitons renvoyer à partir de documents issus du Web, ceux apportant des informations nouvelles sur une entité donnée. Ces documents peuvent ainsi servir à mettre à jour un profil existant (par exemple une page Wikipedia) de cette entité. Notre approche se base initialement sur un appariement des mentions de l'entité afin de renvoyer un premier ensemble de documents pertinents, puis s'appuie sur des modèles de langue estimés à partir de différentes unités d'information. Nous avons évalué notre approche dans le cadre de la tâche "Cumulative Citation Recommendation" de TREC KBA 2013. Les résultats montrent l'intérêt des modèles de langue par rapport aux méthodes de l'état de l'art, et que la vitalité est mieux estimée en considérant tout le contenu des documents mentionnant l'entité.
Databáze: OpenAIRE