Predicting SPARQL Query Execution Time and Suggesting SPARQL Queries Based on Query History

Autor: Rakebul Hasan, Fabien Gandon
Přispěvatelé: Web-Instrumented Man-Machine Interactions, Communities and Semantics (WIMMICS), Inria Sophia Antipolis - Méditerranée (CRISAM), Institut National de Recherche en Informatique et en Automatique (Inria)-Institut National de Recherche en Informatique et en Automatique (Inria)-Scalable and Pervasive softwARe and Knowledge Systems (Laboratoire I3S - SPARKS), Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S), Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (1965 - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Laboratoire d'Informatique, Signaux, et Systèmes de Sophia Antipolis (I3S), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA), Inria, Université Nice Sophia Antipolis (... - 2019) (UNS), COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-COMUE Université Côte d'Azur (2015-2019) (COMUE UCA)-Centre National de la Recherche Scientifique (CNRS)-Université Côte d'Azur (UCA)-Université Nice Sophia Antipolis (... - 2019) (UNS)
Předmět:
Zdroj: HAL
[Research Report] RR-8392, Inria. 2013
Popis: In this paper first we address the problem of predicting SPARQL query execution time. Accurately predicting query execution time enables effective workload management, query scheduling, and query optimization. We use machine learning techniques to predict SPARQL query execution time. We generate the training dataset from real queries collected from DBPedia 3.8 query logs. As features of a SPARQL query, we use the SPARQL query algebra operators and different basic graph pattern types that we generate by clustering the training SPARQL queries. We achieved high accuracy (coefficient of determination value of 0.84) for predicting query execution time. Second, we address the problem of suggesting similar SPARQL queries based on query history. Users often need assistance to effectively construct and refine Semantic Web queries. To assist users in constructing and refining SPARQL queries, we provide suggestions of similar queries based on query history. Users can use the suggestions to investigate the similar previous queries and their behaviors.; Dans ce rapport, nous examinons tout d'abord le problème de la prédiction du temps d'exécution des requêtes SPARQL. Prédire avec précision le temps d'exécution des requêtes permet une gestion efficace de la charge de travail, la planification et l'optimisation des requêtes. Nous utilisons des techniques d'apprentissage automatique pour prédire le temps d'exécution des requêtes SPARQL. Nous générons l'ensemble de données d'apprentissage à partir de requêtes réelles recueillies dans les logs de DBPedia 3.8. Comme caractéristiques d'une requête SPARQL, nous utilisons les opérateurs de l'algèbre de requêtes SPARQL et les différents types de motifs de graphes requêtes que nous générons par le regroupement des requêtes SPARQL d'apprentissage. Nous obtenons une précision élevée (coefficient de valeur de détermination de 0,84) pour prédire le temps d'exécution des requêtes. Deuxièmement, les utilisateurs ont souvent besoin d'aide pour construire efficacement et d'affiner les requêtes au Web sémantique. Pour aider les utilisateurs à construire et affiner les requêtes SPARQL, nous fournissons des suggestions de requêtes similaires basées sur l'historique des requêtes. Les utilisateurs peuvent utiliser ces suggestions pour étudier les précédentes requêtes similaires et leurs comportements.
Databáze: OpenAIRE