The method and system for extracting information from a plurality of
articles and for storing the extracted information in a knowledge-based
information store. The method and system identify a plurality of articles
from which information is to be extracted. The method and system identify
and assign a plurality of information extractors for extracting
information from the plurality of articles. The method and system receive
information extracted by an information extractor from an article assigned
to the information extractor. The method and system enable a content
reviewer to review the extracted information received from the information
extractor and the content reviewer identifies errors associated with the
extracted information. If the error count is above the threshold level,
the article may be reassigned for information extraction. If the error
count is equal to or below the threshold level, the content reviewer may
change the extracted information to correct the errors.
El método y el sistema para extraer la información de una pluralidad de artículos y para almacenar la información extraída en un almacén basado en el conocimiento de la información. El método y el sistema identifican una pluralidad de artículos de los cuales la información deba ser extraída. El método y el sistema identifican y asignan una pluralidad de extractores de la información para extraer la información de la pluralidad de artículos. El método y el sistema reciben la información extraída por un extractor de la información de un artículo asignado al extractor de la información. El método y el sistema permiten a un revisor contento repasar la información extraída recibida del extractor de la información y el revisor contento identifica los errores asociados a la información extraída. Si la cuenta del error está sobre el límite de alarma, el artículo se puede reasignar para la extracción de la información. Si la cuenta del error es igual o debajo del límite de alarma, el revisor contento puede cambiar la información extraída para corregir los errores.