Techniques for generating sophisticated representations of the contents of
both queries and documents in a retrieval system by using natural language
processing (NLP) techniques to represent, index, and retrieve texts at the
multiple levels (e.g., the morphological, lexical, syntactic, semantic,
discourse, and pragmatic levels) at which humans construe meaning in
writing. The user enters a query and the system processes the query to
generate an alternative representation, which includes conceptual-level
abstraction and representations based on complex nominals (CNs), proper
nouns (PNs), single terms, text structure, and logical make-up of the
query, including mandatory terms. After processing the query, the system
displays query information to the user, indicating the system's
interpretation and representation of the content of the query. The user is
then given an opportunity to provide input, in response to which the
system modifies the alternative representation of the query. Once the user
has provided desired input, the possibly modified representation of the
query is matched to the relevant document database, and measures of
relevance generated for the documents. A set of documents is presented to
the user, who is given an opportunity to select some or all of the
documents, typically on the basis of such documents being of particular
relevance. The user then initiates the generation of a query
representation based on the alternative representations of the selected
document(s).
Técnicas para gerar respresentações sofisticadas dos índices de ambas as perguntas e de originais em um sistema de recuperação usando técnicas processar de língua natural (NLP) representar, posicionar, e recuperar textos nos níveis múltiplos (por exemplo, o morphological, lexical, sintático, semântico, discurso, e níveis pragmatic) em que os seres humanos interpretam o meaning na escrita. O usuário incorpora uma pergunta e o sistema processa a pergunta para gerar uma respresentação alternativa, que inclua o abstraction e as respresentações do conceptual-nível baseados nos substantivos complexos (CNs), em substantivos apropriados (PNs), em únicos termos, em estrutura do texto, e na composição lógica da pergunta, including termos imperativos. Após ter processado a pergunta, as exposições do sistema perguntam a informação ao usuário, indicando a interpretação do sistema e a respresentação do índice da pergunta. O usuário é dado então uma oportunidade de fornecer a entrada, em resposta a que o sistema modifica a respresentação alternativa da pergunta. Uma vez que o usuário forneceu a entrada desejada, a respresentação possivelmente modificada da pergunta está combinada à base de dados relevante do original, e às medidas da relevância geradas para os originais. Um jogo dos originais é apresentado ao usuário, que é dado uma oportunidade de selecionar alguns ou todos os originais, tipicamente na base de tais originais que são da relevância particular. O usuário inicía então a geração de uma respresentação da pergunta baseada nas respresentações alternativas do document(s) selecionado.