A system for automatically extracting data from at least one electronic
document accessible through the Internet or other computer network. The
system records a sequence of actions operable to electronically navigate
to a target page of the electronic document, the target page including a
plurality of elements each having contents and a structural definition
wherein the structural definitions interrelate the plurality of elements
to specify a target pattern for a select subset of the plurality of
elements. After recording the navigation path and the target pattern, the
system automatically accesses the target page according to the recorded
sequence. When the target page is accessed, the system automatically
identifies, copies and processes selections from the plurality of elements
dependent upon the target pattern.
Un sistema para automáticamente extraer datos por lo menos de un documento electrónico accesible a través del Internet o de la otra red de ordenadores. El sistema registra una secuencia de las acciones operables para navegar electrónicamente a una página de la blanco del documento electrónico, a la página incluyendo una pluralidad de elementos cada uno de la blanco que tiene contenido y a una definición estructural en donde las definiciones estructurales correlacionan la pluralidad de elementos para especificar un patrón de la blanco para un subconjunto selecto de la pluralidad de elementos. Después de registrar la trayectoria de la navegación y el patrón de la blanco, el sistema tiene acceso automáticamente a la página de la blanco según la secuencia registrada. Cuando la página de la blanco está alcanzada, el sistema identifica, las copias y procesa automáticamente selecciones de la pluralidad de elementos dependientes sobre el patrón de la blanco.