An information retrieval system that deals with the problems of synonymy, polysemy, and retrieval by concept by allowing for a wide margin of uncertainty in the initial choice of keywords in a query. For each input query vector and an information matrix, the disclosed system solves an optimization problem which maximizes the stability of a solution at a given level of misfit. The disclosed system may include a decomposition of the information matrix in terms of orthogonal basis functions. Each basis encodes groups of conceptually related keywords. The bases are arranged in order of decreasing statistical relevance to a query. The disclosed search engine approximates the input query with a weighted sum of the first few bases. Other commercial applications than the disclosed search engine can also be built on the disclosed techniques.

Un sistema de la recuperación de datos que se ocupa de los problemas de la sinonimia, de la polisemia, y de la recuperación por concepto teniendo en cuenta un margen ancho de la incertidumbre en la opción inicial de palabras claves en una pregunta. Para cada vector de la pregunta de la entrada y una matriz de la información, el sistema divulgado soluciona un problema de la optimización que maximice la estabilidad de una solución en un nivel dado de la cosa mal encajada. El sistema divulgado puede incluir una descomposición de la matriz de la información en términos de las funciones orthogonal de la base. Cada base codifica los grupos de palabras claves conceptual relacionadas. Las bases se arreglan en la orden de disminuir importancia estadística a una pregunta. El Search Engine divulgado aproxima la pregunta de la entrada con una suma cargada de las bases primeras. Otros usos comerciales que el Search Engine divulgado se pueden también construir en las técnicas divulgadas.

 
Web www.patentalert.com

< (none)

< Document search method for registering documents, generating a structure index with elements having position of occurrence in documents represented by meta-nodes

> Broadcast service access control

> (none)

~ 00058