A system and method for automated browsing and data extraction from
Internet Web sites. Our preferred method and system selects various data
elements within the Web site during a design phase and extracts data from
the Web site based on the matching of the selected data elements at the
Web site during a playback phase. Another preferred method and system
extracts XML data based on matching previously selected XML data elements
during a design phase with XML data elements present during a playback
phase, and reformats the extracted XML data into a relational format.
Un sistema y un método para la extracción automatizada el hojear y de datos de sitios de la tela del Internet. Nuestro método y sistema preferidos selecciona varios elementos de datos dentro del Web site durante una fase del diseño y extrae datos del Web site basado en emparejar de los elementos de datos seleccionados en el Web site durante una fase del aparato de lectura. Otros datos preferidos de los extractos XML del método y del sistema basados en emparejar elementos de datos previamente seleccionados de XML durante una fase del diseño con los elementos de datos de XML presentan durante una fase del aparato de lectura, y cambian formato los datos extraídos de XML en un formato emparentado.