A data analysis and classification system that reads the electronic
information, analyzes the electronic information according to a
user-defined set of logical rules, and returns a classification result.
The data analysis and classification system may accept any form of
computer-readable electronic information. The system creates a hash table
wherein each entry of the hash table contains a concept corresponding to a
word or phrase which the system has previously encountered. The system
creates an object model based on the user-defined logical associations,
used for reviewing each concept contained in the electronic information in
order to determine whether the electronic information is classified. The
data analysis and classification system extracts each concept in turn from
the electronic information, locates it in the hash table, and propagates
it through the object model. In the event that the system can not find the
electronic information token in the hash table, that token is added to a
missing terms list. If any rule is satisfied during propagation of the
concept through the object model, the electronic information is
classified.
Un análisis de datos y un sistema de clasificación que lee la información electrónica, analiza la información electrónica según un sistema definido por el usario de reglas lógicas, y vuelve un resultado de la clasificación. El análisis de datos y el sistema de clasificación pueden aceptar cualquier forma de información electrónica legible por computador. El sistema crea una tabla del picadillo en donde cada entrada de la tabla del picadillo contiene un concepto que corresponde a una palabra o a una frase que el sistema ha encontrado previamente. El sistema crea un modelo del objeto basado en las asociaciones lógicas definidas por el usario, usadas para repasar cada concepto contenido en la información electrónica para determinarse si la información electrónica está clasificada. El análisis de datos y el sistema de clasificación extrae cada concepto alternadamente de la información electrónica, lo localiza en la tabla del picadillo, y lo propaga a través del modelo del objeto. En caso que el sistema no pueda encontrar la información electrónica simbólica en la tabla del picadillo, ese símbolo se agrega a una lista que falta de los términos. Si cualquier regla está satisfecha durante la propagación del concepto a través del modelo del objeto, se clasifica la información electrónica.