Détection automatique des sessions de recherche par similarité des résultats provenant d'une collection de documents externe - Archive ouverte HAL Access content directly
Conference Papers Year : 2013

Détection automatique des sessions de recherche par similarité des résultats provenant d'une collection de documents externe

(1) , (2)
1
2

Abstract

Search engines users apply complex search behaviours such as query reformulation and multitasking search to satisfy their information needs. These search behaviours may be observed through query logs, and constitute clues allowing a better understanding of users' needs. In this perspective, it is decisive to group queries related to the same information need into a unique search session. We propose an automatic session detection method exploiting the WIKIPEDIA documents collection, based on the similarity between the results returned for each query pair to estimate the similarity between queries. This method shows better performance than both temporal and lexical approaches traditionally used for successive session detection, and can be applied as well to multitasking search session detection. These experiments were conducted on a dataset originating from the OpenEdition Web portal.
Les utilisateurs d'un système de recherche d'information mettent en œuvre des comportements de recherche complexes tels que la reformulation de requête et la recherche multitâche afin de satisfaire leurs besoins d'information. Ces comportements de recherche peuvent être observés à travers des journaux de requêtes, et constituent des indices permettant une meilleure compréhension des besoins des utilisateurs. Dans cette perspective, il est nécessaire de regrouper au sein d'une même session de recherche les requêtes reliées à un même besoin d'information. Nous proposons une méthode de détection automatique des sessions exploitant la collection de documents WIKIPÉDIA, basée sur la similarité des résultats renvoyés par l'interrogation de cette collection afin d'évaluer la similarité entre les requêtes. Cette méthode obtient de meilleures performances que les approches temporelle et lexicale traditionnellement employées pour la détection de sessions séquentielles, et peut être appliquée à la détection de sessions imbriquées. Ces expérimentations ont été réalisées sur des données provenant du portail OpenEdition.
Fichier principal
Vignette du fichier
Leva-Faessel-RECITAL-2013.pdf (134.59 Ko) Télécharger le fichier
Origin : Files produced by the author(s)
Loading...

Dates and versions

hal-00982483 , version 1 (23-04-2014)

Identifiers

  • HAL Id : hal-00982483 , version 1

Cite

Simon Leva, Nicolas Faessel. Détection automatique des sessions de recherche par similarité des résultats provenant d'une collection de documents externe. 15e Rencontre des Étudiants Chercheurs en Informatique pour le Traitement Automatique des Langues (RECITAL 2013), Jun 2013, Les Sables d'Olonne, France. pp.217-230. ⟨hal-00982483⟩
276 View
78 Download

Share

Gmail Facebook Twitter LinkedIn More