The present invention relates to the field of information extraction and
storage and more specifically to techniques for extracting information
from a plurality of articles in a distributed manner and for storing the
extracted information in an information store. an embodiment of the
present invention identifies a plurality of articles from which
information is to be extracted and a plurality of information extractors
for extracting the information from the articles. A database is provided
for storing information related to the plurality of articles and the
plurality of information extractors. The plurality of articles are
assigned to the plurality of information extractors for information
extraction. Information extracted by information extractors from the
articles is stored in the information store.
La actual invención se relaciona con el campo de la extracción y del almacenaje de la información y más específicamente con las técnicas para extraer la información de una pluralidad de artículos de una manera distribuida y para almacenar la información extraída en un almacén de la información. una encarnación de la actual invención identifica una pluralidad de artículos de los cuales la información deba ser extraída y una pluralidad de extractores de la información para extraer la información de los artículos. Una base de datos se proporciona para almacenar la información relacionada con la pluralidad de artículos y la pluralidad de extractores de la información. La pluralidad de artículos se asigna a la pluralidad de extractores de la información para la extracción de la información. La información extraída por los extractores de la información de los artículos se almacena en el almacén de la información.