Agent intelligent de crawling et de scraping pour le SIE XEW

Autor: El Haddadi, Anass, Fennan, Abdelhadi, Dousset, Bernard, El Haddadi, Amine, Boulouard, Zakaria
Přispěvatelé: Grélaud, Françoise, École nationale des sciences appliquées d'Al Hoceima (ENSAH), Faculté des sciences et Techniques de Tanger, Université Abdelmalek Essaâdi (UAE), Systèmes d’Informations Généralisées (IRIT-SIG), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Toulouse III - Paul Sabatier (UT3), Université Ibn Zohr [Agadir], IRIT (Institut de Recherche en Informatique de Toulouse)
Jazyk: francouzština
Rok vydání: 2015
Předmět:
Zdroj: 5ème Séminaire Veille Stratégique Scientifique et Technologique (VSST 2015)
5ème Séminaire Veille Stratégique Scientifique et Technologique (VSST 2015), IRIT (Institut de Recherche en Informatique de Toulouse), May 2015, Grenade, Espagne
Popis: International audience; Cette communication décrit les fonctionnalités de l’agent intelligent XEW-CR (Explore every where) qui vise à répondre à la problématique de trouver l’information utile dans un environnement web, caractérisé par l’abondance et l’hétérogénéité des formats de données et des informations disponibles sur un sujet. La fonctionnalité crawling de l’outil permet de parcourir, d’indexer et de cartographier les pages web en se basant sur le contenu de la page ou de l’URL. Le scraping est moins limitatif car cela consiste à extraire le contenu des pages web pour l’utiliser à des fins de data mining et de stockage de l’information utile dans une base de donnée décisionnelle.
Databáze: OpenAIRE