A method and apparatus is provided for producing a general data extraction
procedure capable of extracting data from data sources on a network
regardless of data format. The general data extraction procedure is
determined from a plurality of pairs of data from the network, each pair
including a data source and a program which accurately extracts data from
the data source. The pairs of data are processed by a learning system to
learn a general program for extracting data from new data sources.
Метод и прибор обеспечены для производить вообще процедуру по извлечения данных способную извлекать данные от источников данных на сети regardless of формат данных. Вообще процедура по извлечения данных обусловлена от множественности пар данных от сети, каждой пары включая источник данных и программы которая точно извлекает данные от источника данных. Пары данных обработаны учя системой для того чтобы выучить вообще программу для извлекать данные от новых источников данных.