An apparatus is provided for relating user queries and documents. The
apparatus includes a client, a server, and a database being mutually
coupled to a communications pathway. The client is configured to enable a
user to submit user queries to locate documents. The server has a data
mining mechanism configured to receive the user queries and generate
information retrieval sessions. The database stores data in the form of
usage logs generated from the information retrieval sessions. The data
mining mechanism includes a clustering algorithm operative to identify
context groups and usage categories. The data mining mechanism is
operative to identify query contexts associated with individual queries
from the usage logs, partition the queries into context groups having
similar contexts, and compute multiple context groups associated with
specific query keywords from the usage logs. A method is provided for
associating user queries and documents in accordance with the apparatus.
Um instrumento é fornecido relacionando perguntas e originais de usuário. O instrumento inclui um cliente, um usuário, e uma base de dados que está sendo acoplada mutuamente a um pathway das comunicações. O cliente é configurarado para permitir um usuário de submeter perguntas de usuário para encontrar originais. O usuário tem um mecanismo minando dos dados configurarado para receber as perguntas de usuário e para gerar sessões da recuperação de informação. A base de dados armazena dados no formulário dos registros do uso gerados das sessões da recuperação de informação. O mecanismo minando dos dados inclui um operative aglomerando-se do algoritmo para identificar grupos do contexto e categorias do uso. O mecanismo minando dos dados é operativo identificar os contextos da pergunta associados com as perguntas individuais dos registros do uso, dividir as perguntas nos grupos do contexto que têm contextos similares, e computar os grupos múltiplos do contexto associados com os keywords específicos da pergunta dos registros do uso. Um método é fornecido associando perguntas e originais de usuário de acordo com o instrumento.