Populating a data warehouse using a pipeline approach

   
   

Described herein is a data collection and warehousing system that collects log files from a plurality of servers, and that transforms the entries of the log files prior to using them to populate a database. Nightly, the system provides a pre-processing program to each of the servers. The servers executing the pre-processing component to filter the logged data before sending it on to the data collection and warehousing system. The data collection and warehousing system pre-parses each received log file to create dimension and fact tables. During this process, strings are replaced by keys. These keys are calculated on-the-fly by taking a hash of each string. The resulting tables are then further parsed to create further dimension and fact tables that correspond to each of the dimension and fact tables of a relational database schema. After further processing, these tables are loaded into a data warehousing system.

Описаны здесь собрание данных и warehousing система собирают архивы журнала от множественности серверов, и которая преобразовывает входы архивов журнала перед использование их заселить базу данных. Nightly, система снабубежит программу препроцессирования каждый из серверов. Серверы исполняя компонент препроцессирования для того чтобы фильтровать внесенные в журнал данные перед посылать его дальше к собранию данных и warehousing системе. Собрание данных и warehousing система пре-pre-parses каждый полученный архив журнала для того чтобы создать таблицы размера и факта. Во время этого процесса, шнуры заменены ключами. Эти ключи высчитаны on-the-fly путем принимать хэш каждого шнура. Приводя к таблицы после этого дальнейшие parsed к создают более дальнейшие таблицы размера и факта соответствуют к каждой из таблиц размера и факта схимы реляционной базы данных. После дальнейшей обработки, эти таблицы нагружены в систему данных warehousing.

 
Web www.patentalert.com

< Tracking semantic objects in vector image sequences

< Online service registration system and method

> Method and system for efficient storage and restoration of display state data

> Automatic database statistics creation

~ 00108