A data import system enables access to data of multiple types from multiple
data sources of different formats and provides an interface for importing
data into a data analysis system. The interface enables a user to
customize the formatting of the data as the data is being imported into a
data analysis system. A user may select first user defined options for
operating on a first data set received during a data importation process.
An intermediate representation of the data set is generated based on the
user first defined options. A user may specify second user defined options
based on the intermediate representation during the data importation
process. The second user defined options are processed to produce a final
data representation of the data set to be used for analysis of the data.
The intermediate representation may be a data table. The processing of a
data set may include merging a first and second data set to produce the
final data representation. The second user defined options may enable a
user to select a basic operation for merging the data sets or to select a
non-basic operation for merging the data sets. The basic operation may
combine data sets in response to a user's selection of a first graphical
interface control, and the non-basic operation may combine the data sets
based on user selection of at least two graphical interface controls from
a group of graphical interface controls.
Un sistema de la importación de los datos permite el acceso a los datos de tipos múltiples de fuentes de datos múltiples de diversos formatos y proporciona un interfaz para los datos de importación en un sistema del análisis de datos. El interfaz permite a un usuario modificar el formato para requisitos particulares de los datos mientras que los datos se están importando en un sistema del análisis de datos. Un usuario puede seleccionar las opciones definidas primer usuario para funcionar en un primer modem recibido durante un proceso de la importación de los datos. Una representación intermedia del modem se genera basó en las opciones primero definidas del usuario. Un usuario puede especificar las opciones definidas segundo usuario basadas en la representación intermedia durante el proceso de la importación de los datos. Las opciones definidas segundo usuario se procesan para producir una representación de datos final del modem que se utilizará para el análisis de los datos. La representación intermedia puede ser una tabla de los datos. El proceso de un modem puede incluir la combinación de un primer y segundo modem para producir la representación de datos final. Las opciones definidas segundo usuario pueden permitir a un usuario seleccionar una operación básica para combinar los modems o seleccionar una operación no-ba'sica para combinar los modems. La operación básica puede combinar modems en respuesta a la selección de un usuario de un primer control gráfico del interfaz, y la operación no-ba'sica puede combinar los modems basados en la selección del usuario por lo menos de dos controles gráficos del interfaz de un grupo de controles gráficos del interfaz.