Document clustering method and system utilizing both the log-based
clustering method and the content-based clustering method are disclosed.
The method includes the steps of generating log-based document clusters
and combining vectors from the log-based document clusters with individual
document clusters for content-based clustering analysis. The log-based
document clusters are generated by accessing the retrieval session log,
clustering the retrieval sessions, and combining the documents opened
during each of the sessions of session clusters.
La méthode et le système groupants de document utilisant la méthode groupante notation-basée et la méthode groupante contenu-basée sont révélés. La méthode inclut les étapes de produire des faisceaux notation-basés de document et de combiner des vecteurs des faisceaux notation-basés de document avec différents faisceaux de document pour l'analyse groupante contenu-basée. Les faisceaux notation-basés de document sont produits en accédant à la notation de session de récupération, en groupant les sessions de récupération, et en combinant les documents ouverts pendant la chacune des sessions des faisceaux de session.