Définir les catégories de DBpedia avec des règles d'associations et des redescriptions

Autor: Reynaud, Justine, Galbrun, Esther, Alam, Mehwish, Toussaint, Yannick, Napoli, Amedeo
Přispěvatelé: Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Knowledge representation, reasonning (ORPAILLEUR), Inria Nancy - Grand Est, Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Department of Natural Language Processing & Knowledge Discovery (LORIA - NLPKD), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Institut National de Recherche en Informatique et en Automatique (Inria)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Centre National de la Recherche Scientifique (CNRS), Laboratoire d'Informatique de Paris-Nord (LIPN), Université Sorbonne Paris Cité (USPC)-Institut Galilée-Université Paris 13 (UP13)-Centre National de la Recherche Scientifique (CNRS), Reynaud, Justine, Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Laboratoire Lorrain de Recherche en Informatique et ses Applications (LORIA), Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL)-Institut National de Recherche en Informatique et en Automatique (Inria)-Centre National de la Recherche Scientifique (CNRS)-Université de Lorraine (UL), Université Paris 13 (UP13)-Institut Galilée-Université Sorbonne Paris Cité (USPC)-Centre National de la Recherche Scientifique (CNRS)
Jazyk: francouzština
Rok vydání: 2018
Předmět:
Zdroj: EGC 2018-Extraction et Gestion des Connaissances
EGC 2018-Extraction et Gestion des Connaissances, Jan 2018, Paris, France
Popis: DBpedia, which encode the knowledge of Wikipedia, has become a reference for the web of data. Resources can be indexed by manually-defined categories which are not accessible by a machine.In this article, we intend to give a classificatory role to the categories (including access and use by a machine) by means of data mining techniques such as association rules and redescription mining. We compare these approaches on a dataset from DBpedia and we present our results.
Le web des données s'appuie sur un ensemble de triplets codés avec RDF. Ces triplets représentent des relations entre les ressources qu'il faut pouvoir exploiter, notamment pour la recherche d'informations et autres traitements automatiques. DBpédia, qui encode les connaissances de Wikipédia, est devenue une base de référence pour le web des données. Les ressources peuvent y être répertoriées par des catégories définies manuellement, dont la sémantique n'est pas directement accessible par des machines. Dans cet article, nous proposons de donner un rôle classificatoire aux catégories (afin de permettre aux machines d'accèder et d'exploiter leur sémantique) au moyen de méthodes de fouille de données, à savoir la recherche de règles d'associations et de motifs apparentés. Nous présentons une étude comparative de ces variantes sur une partie de DB-pédia et discutons le potentiel des différentes approches.
Databáze: OpenAIRE