Processing automatically information in a document to be incorporated into
databases to be searched, retrieved and learned. This would significantly
enhance categorizing information in the domain so that information can be
systematically and efficiently retrieved when needed. In one approach,
first, the context or the domain of the document is determined. Then,
domain-specific phrases in the document are automatically extracted based
on grammar and dictionaries. From these phrases, categories in a category
hierarchy are identified, and the document is linked to those categories.
Phrases in the document that cannot be categorized are identified to be
analyzed. If these new phrases are relevant, new categories may be created
based on suggestions provided to categorize them. Later when a user asks a
question that is related to the categorized phrases, the corresponding
categories are identified, with the document retrieved to respond to the
question. In one approach, the question is in natural-language.
Procesando automáticamente la información en un documento que se incorporará en las bases de datos que se buscarán, recuperadas y aprendidas. Esto realzaría perceptiblemente categorizar la información en el dominio de modo que la información pueda estar sistemáticamente y lo recuperó eficientemente cuando estaba necesitada. En un acercamiento, el primer, el contexto o el dominio del documento se determina. Entonces, las frases dominio-especi'ficas en el documento automáticamente se extraen basadas en la gramática y diccionarios. De estas frases, las categorías en una jerarquía de la categoría se identifican, y el documento se liga a esas categorías. Las frases en el documento que no puede ser categorizado se identifican para ser analizadas. Si estas nuevas frases son relevantes, las nuevas categorías se pueden crear basaron en las sugerencias proporcionadas para categorizarlas. Más adelante cuando un usuario hace una pregunta que se relacione con las frases categorizadas, las categorías correspondientes se identifican, con el documento recuperado para responder a la pregunta. En un acercamiento, la pregunta está en de lenguaje natural.