Efficient data modeling utilizing sparse representation of a data set. In
one embodiment, a computer-implemented method such that a data set is
first input. The data set has a plurality of records. Each record has at
least one attribute, where each attribute has a default value. The method
stores a sparse representation of each record, such that the value of each
attribute of the record is stored only if the value of the attribute
varies from the default value. A data model is then generated, utilizing
the sparse representation, and the model is output. The generation of the
data model in one embodiment is in accordance with the Expectation
Maximization (EM) algorithm.
Datos eficientes que modelan utilizando la representación escasa de un modem. En una encarnación, un método computadora-puesto en ejecucio'n tales que un modem es primera entrada. El modem tiene una pluralidad de expedientes. Cada expediente tiene por lo menos una cualidad, donde cada cualidad tiene un valor prefijado. El método almacena una representación escasa de cada expediente, tal que el valor de cada cualidad del expediente está almacenado solamente si el valor de la cualidad varía del valor prefijado. Un modelo de los datos entonces se genera, utilizando la representación escasa, y se hace salir el modelo. La generación del modelo de los datos en una encarnación está de acuerdo con el algoritmo de la maximización de la expectativa (EM).