An information retrieval system that deals with the problems of synonymy,
polysemy, and retrieval by concept by allowing for a wide margin of
uncertainty in the initial choice of keywords in a query. For each input
query vector and an information matrix, the disclosed system solves an
optimization problem which maximizes the stability of a solution at a
given level of misfit. The disclosed system may include a decomposition of
the information matrix in terms of orthogonal basis functions. Each basis
encodes groups of conceptually related keywords. The bases are arranged in
order of decreasing statistical relevance to a query. The disclosed search
engine approximates the input query with a weighted sum of the first few
bases. Other commercial applications than the disclosed search engine can
also be built on the disclosed techniques.
Un sistema de la recuperación de datos que se ocupa de los problemas de la sinonimia, de la polisemia, y de la recuperación por concepto teniendo en cuenta un margen ancho de la incertidumbre en la opción inicial de palabras claves en una pregunta. Para cada vector de la pregunta de la entrada y una matriz de la información, el sistema divulgado soluciona un problema de la optimización que maximice la estabilidad de una solución en un nivel dado de la cosa mal encajada. El sistema divulgado puede incluir una descomposición de la matriz de la información en términos de las funciones orthogonal de la base. Cada base codifica los grupos de palabras claves conceptual relacionadas. Las bases se arreglan en la orden de disminuir importancia estadística a una pregunta. El Search Engine divulgado aproxima la pregunta de la entrada con una suma cargada de las bases primeras. Otros usos comerciales que el Search Engine divulgado se pueden también construir en las técnicas divulgadas.