A method and system to facilitate searching a data collection, such as the
World Wide Web, that takes advantage of the collective ability of all
users to create queries to the data collection. First, a node-link graph
of all queries submitted to a data collection within a given period of
time is constructed. In the case of the World Wide Web, the queries would
be to a particular search engine. In the graph, each node is a query.
There is a link made between two nodes whenever the two queries are judged
to be related. A first key idea is that the determination of relatedness
depends on the documents returned by the queries, not on the actual terms
in the queries themselves. For example, a criterion for relatedness could
be that of the top ten documents returned for each query, the two lists
have at least one document in common. The invention also describes a way
to allow the user to peruse the network of related queries in an ordered
way: following a path from a first cousin, to a second cousin to a third
cousin, etc. to a set of results. By doing this, the user is exposed to
related documents that were not returned as a result of their query. A
second key idea is that the construction of the query graph transforms
single user usage of the data collection (e.g. search) into collaborative
usage: all users can tap into the knowledge base of queries submitted by
others. This is because each of the related queries represents the
knowledge of the user who submitted the query.
Une méthode et un système pour faciliter rechercher une collecte de données, telle que le Web mondial, qui tire profit de la capacité collective de tous les utilisateurs de créer des questions à la collecte de données. D'abord, un graphique de noeud-lien de toutes les questions soumises à une collecte de données au cours d'une période donnée est construit. Dans le cas du Web mondial, les questions seraient à un Search Engine particulier. Dans le graphique, chaque noeud est une question. Il y a un lien fait entre deux noeuds toutes les fois que les deux questions sont jugées pour être reliées. Une première idée de clef est que la détermination de la parenté dépend des documents retournés par les questions, pas aux conditions réelles dans les questions elles-mêmes. Par exemple, un critère pour la parenté a pu être celui des dix documents principaux retournés pour chaque question, les deux listes ont au moins un document en commun. L'invention décrit également une manière de permettre à l'utilisateur de lire attentivement le réseau des questions relatives d'une manière commandée : après un chemin d'un premier cousin, à un deuxième cousin à un troisième cousin, etc. à un ensemble de résultats. En faisant ceci, l'utilisateur est exposé aux documents relatifs qui n'ont pas été retournés en raison de leur question. Une deuxième idée de clef est que la construction du graphique de question transforme l'utilisation d'utilisateur simple de la collecte de données (par exemple recherche) en utilisation de collaboration : tous les utilisateurs peuvent brancher sur la base de connaissance des questions soumises par d'autres. C'est parce que chacune des questions relatives représente la connaissance de l'utilisateur qui a soumis la question.