Personalized information retrieval: Using A Semantic User Profile Inferred from Domain Ontology through the user search sessions

Autor: Daoud, Mariam
Přispěvatelé: Systèmes d’Informations Généralisées (IRIT-SIG), Institut de recherche en informatique de Toulouse (IRIT), Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées-Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse - Jean Jaurès (UT2J)-Université Toulouse III - Paul Sabatier (UT3), Université Fédérale Toulouse Midi-Pyrénées-Centre National de la Recherche Scientifique (CNRS)-Institut National Polytechnique (Toulouse) (Toulouse INP), Université Fédérale Toulouse Midi-Pyrénées-Université Toulouse 1 Capitole (UT1), Université Fédérale Toulouse Midi-Pyrénées, Université Paul Sabatier - Toulouse III, Mohand Boughanem, Lynda Tamine-Lechani(bougha@irit.fr, lechani@irit.fr)
Jazyk: francouzština
Rok vydání: 2009
Předmět:
Zdroj: Informatique [cs]. Université Paul Sabatier-Toulouse III, 2009. Français
Popis: Contextual information retrieval aims at combining knowledge about the query context and the user context in the same framework in order to better meet the user information needs. We propose a search personalization approach integrating user intent prediction and semantic user profile modelling. We exploit the query context for predicting the user intent as being informational related to content retrieval, navigational related to web site retrieval or transactional related to the online service retrieval. Predicting the user intent consists of combining morphologic query characteristics and the session context defined by the user intent held by the associated queries. We proposed then to exploit the user profile in a personalized information access in order to improve the retrieval effectiveness. We defined the short-term user profile by a user interest that could be held across multiples search sessions related to the same user information need. It is built by exploiting the user's documents of interests and an external semantic resource, mainly the ODP ontology, which serves to infer a semantic representation of the user profile Based on short-term user profiles built across the user search sessions, we model the long-term user profile by aggregating short-term ones. Long-term user profile is used to initialise a short-term user profile in a search session to answer recurrent queries. The user profile is then used to re-rank search results of related queries in the same search session. We have validated our approach of predicting the user intent behind the query using TREC collections, that include queries annotated by the user intents, and compare it to a basic classifier based on supervised learning technique. On the other hand, as there is no standard evaluation protocol for evaluating personalized access retrieval, we have proposed context-oriented evaluation protocols based on enhancing TREC collection with simulated user profiles and search sessions. We have exploited these protocols to evaluate our contribution in the domain. Finally, we have compared experimentally our approach to a well known approach in the domain and show the effectiveness of our approach.; Le but fondamental de la recherche d'information (RI) contextuelle consiste à combiner des sources d'évidences issues du contexte de la requête et du contexte de l'utilisateur dans une même infrastructure afin de mieux caractériser les besoins en information de l'utilisateur et améliorer les résultats de la recherche. Notre contribution porte sur la conception d'un système de RI personnalisé intégrant la caractérisation du type de recherche véhiculé par la requête ainsi que la modélisation et construction de profils sémantiques des utilisateurs. Nous exploitons le contexte de la requête dans un mécanisme de prédiction du type de recherche en tant qu'informationnel lié à la recherche par contenu, navigationnel lié à la recherche des sites d'accueil et transactionnel lié à la recherche des services en ligne. Notre approche de prédiction du type de recherche consiste à combiner des sources d'évidences issues des caractéristiques morphologiques de la requête d'une part et le profil de la session défini par le type de recherche porté par la session de recherche d'autre part. Nous nous intéressons ensuite à exploiter, dans un premier temps, le profil de l'utilisateur à court terme dans un processus d'accès personnalisé à l'information. Le profil à court terme traduit généralement un centre d'intérêt de l'utilisateur construit sur la base d'une ou plusieurs sessions de recherche traitant un même besoin en information. Ce profil est construit en exploitant les documents jugés pertinents par l'utilisateur et une ressource sémantique, en l'occurrence une ontologie de base, servant à la représentation conceptuelle du profil. Dans un second temps, le profil à long terme de l'utilisateur est construit par agrégation des profils utilisateurs à court terme construits au cours des sessions de recherche de l'utilisateur. Nous exploitons le profil de l'utilisateur à long terme dans l'initialisation du profil dans une session de recherche traitant un besoin en information récurrent. Le profil de l'utilisateur créé ou qui évolue dans une même session de recherche est utilisé dans le ré-ordonnancement des résultats de recherche des requêtes appartenant à la même session. Nous avons validé notre approche de prédiction du type de recherche sur une collection de requêtes annotées de TREC par comparaison à un classifieur classique. En outre, vu qu'il n'existe pas des cadres d'évaluation standards d'accès personnalisé à l'information, plus particulièrement adaptés à la personnalisation à court terme, nous avons proposé des cadres d'évaluation orienté-contexte basé sur l'augmentation des collections de la campagne TREC par des profils utilisateurs et des sessions de recherche simulés. Nous avons exploité ces cadres d'évaluation pour valider notre contribution dans le domaine. Nous avons également comparé expérimentalement notre contribution à une approche de personnalisation reconnue dans le domaine et avons montré que notre approche est à l'origine d'un un gain de performance significatif.
Databáze: OpenAIRE