Extraction de clusters à partir du treillis de concepts : application à la découverte de communautés d'intérêt pour améliorer l'accès à l'information

Autor: Nicolas Durand
Přispěvatelé: Equipe CODAG - Laboratoire GREYC - UMR6072, Groupe de Recherche en Informatique, Image et Instrumentation de Caen (GREYC), Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU)-Normandie Université (NU)-Université de Caen Normandie (UNICAEN), Normandie Université (NU)-Centre National de la Recherche Scientifique (CNRS)-École Nationale Supérieure d'Ingénieurs de Caen (ENSICAEN), Normandie Université (NU), France Télécom Recherche & Développement (FT R&D), France Télécom, Université de Caen Basse-Normandie, Khaldoun Zreik, Bruno Crémilleux, Luigi Lancieri, DURAND, Nicolas
Jazyk: francouzština
Rok vydání: 2004
Předmět:
Zdroj: Informatique [cs]. Université de Caen Basse-Normandie, 2004. Français
HAL
Popis: This work is related to the CYRANO RNRT project, whose aim is to improve the access to information, in term of rapidity of download and information retrieval. This thesis proposes a new recommendation system of documents, which is based on a new method of clusters discovery, called ECCLAT, to group the users into interest communities. The main advantage of this method is to produce overlapping clusters of users from categorical data. ECCLAT was also used in other domains such as medicine. A new prefetching system, called PrefetchEm, is also presented. This system is founded on an optimisation of the user characterizations, based on the detection of emerging information in order to reflect their tastes and their tendencies. The experimentations are done with real accesses performed by users of proxies-caches of France Telecom R&D.
Le cadre de ces travaux correspond au projet RNRT CYRANO, dont le but est d'améliorer l'accès à l'information, à la fois en terme de sélection et de rapidité. Cette thèse propose un système de recommandation de documents aux utilisateurs. Ce système s'appuie sur une nouvelle méthode de découverte de clusters, appelée ECCLAT, pour regrouper les utilisateurs en communautés d'intérêt. Le principal avantage de cette méthode est de produire des clusters non-disjoints d'utilisateurs à partir de données qualitatives. ECCLAT a aussi été utilisée dans d'autres domaines comme la médecine. Un nouveau système de pré-chargement de documents, appelé PrefetchEm, est aussi proposé. Il repose sur une optimisation de la caractérisation des utilisateurs, basée sur la détection d'informations émergentes pour traduire leurs goûts et leurs tendances. Les expérimentations sont réalisées avec des accès réels effectués par des utilisateurs de serveurs mandataires-caches de France Télécom R&D.
Databáze: OpenAIRE