The present invention relates to the field of information extraction and
storage and more specifically to techniques for extracting information
from a plurality of articles in a distributed manner and for storing the
extracted information in an information store. an embodiment of the
present invention identifies a plurality of articles from which
information is to be extracted and a plurality of information extractors
for extracting the information from the articles. A database is provided
for storing information related to the plurality of articles and the
plurality of information extractors. The plurality of articles are
assigned to the plurality of information extractors for information
extraction. Information extracted by information extractors from the
articles is stored in the information store.
La présente invention concerne le champ de l'extraction et du stockage de l'information et plus spécifiquement aux techniques pour extraire l'information à partir d'une pluralité d'articles d'une façon distribuée et pour stocker l'information extraite dans un magasin de l'information. un mode de réalisation de la présente invention identifie une pluralité d'articles à partir desquels l'information doit être extraite et une pluralité d'extracteurs de l'information pour extraire l'information à partir des articles. Une base de données est donnée pour stocker l'information liée à la pluralité d'articles et à la pluralité d'extracteurs de l'information. La pluralité d'articles sont assignées à la pluralité d'extracteurs de l'information pour l'extraction de l'information. L'information extraite par des extracteurs de l'information à partir des articles est stockée dans le magasin de l'information.