The present invention relates to the field of information extraction and
storage and more specifically to techniques for extracting information
from a plurality of articles in a distributed manner and for storing the
extracted information in an information store. an embodiment of the
present invention identifies a plurality of articles from which
information is to be extracted and a plurality of information extractors
for extracting the information from the articles. A database is provided
for storing information related to the plurality of articles and the
plurality of information extractors. The plurality of articles are
assigned to the plurality of information extractors for information
extraction. Information extracted by information extractors from the
articles is stored in the information store.
La presente invenzione riguarda il campo dell'estrazione e dell'immagazzinaggio delle informazioni e più specificamente alle tecniche per l'estrazione delle informazioni da una pluralità di articoli in un modo distribuito e per memorizzare le informazioni estratte in un deposito delle informazioni. un metodo di realizzazione di presente invenzione identifica una pluralità di articoli da cui le informazioni devono essere estratte e una pluralità di estrattori delle informazioni per l'estrazione delle informazioni dagli articoli. Una base di dati è fornita per memorizzare le informazioni relative alla pluralità di articoli ed alla pluralità di estrattori delle informazioni. La pluralità di articoli è assegnata alla pluralità di estrattori delle informazioni per l'estrazione delle informazioni. Le informazioni estratte dagli estrattori delle informazioni dagli articoli sono memorizzate nel deposito delle informazioni.