Processing automatically information in a document to be incorporated into databases to be searched, retrieved and learned. This would significantly enhance categorizing information in the domain so that information can be systematically and efficiently retrieved when needed. In one approach, first, the context or the domain of the document is determined. Then, domain-specific phrases in the document are automatically extracted based on grammar and dictionaries. From these phrases, categories in a category hierarchy are identified, and the document is linked to those categories. Phrases in the document that cannot be categorized are identified to be analyzed. If these new phrases are relevant, new categories may be created based on suggestions provided to categorize them. Later when a user asks a question that is related to the categorized phrases, the corresponding categories are identified, with the document retrieved to respond to the question. In one approach, the question is in natural-language.

Procesando automáticamente la información en un documento que se incorporará en las bases de datos que se buscarán, recuperadas y aprendidas. Esto realzaría perceptiblemente categorizar la información en el dominio de modo que la información pueda estar sistemáticamente y lo recuperó eficientemente cuando estaba necesitada. En un acercamiento, el primer, el contexto o el dominio del documento se determina. Entonces, las frases dominio-especi'ficas en el documento automáticamente se extraen basadas en la gramática y diccionarios. De estas frases, las categorías en una jerarquía de la categoría se identifican, y el documento se liga a esas categorías. Las frases en el documento que no puede ser categorizado se identifican para ser analizadas. Si estas nuevas frases son relevantes, las nuevas categorías se pueden crear basaron en las sugerencias proporcionadas para categorizarlas. Más adelante cuando un usuario hace una pregunta que se relacione con las frases categorizadas, las categorías correspondientes se identifican, con el documento recuperado para responder a la pregunta. En un acercamiento, la pregunta está en de lenguaje natural.

 
Web www.patentalert.com

< Structured focused hypertext data structure

< Modifying a key-word listing based on user response

> Vertical implementation of expectation-maximization algorithm in SQL for performing clustering in very large databases

> Method and apparatus for creating extractors, field information objects and inheritance hierarchies in a framework for retrieving semistructured information

~ 00073