A system and method for enhancing knowledge discovery from data using
multiple learning machines in general and multiple support vector machines
in particular. Training data for a learning machine is pre-processed in
order to add meaning thereto. Pre-processing data involves transforming
the data points and/or expanding the data points. By adding meaning to the
data, the learning machine is provided with a greater amount of
information for processing. With regard to support vector machines in
particular, the greater the amount of information that is processed, the
better generalizations about the derived data. Multiple support vector
machines, each comprising distinct kernels, are trained with the
pre-processed training data and are tested with test data that is
pre-processed in the same manner. The test outputs from multiple support
vector machines are compared in order to determine which of the test
outputs if any represents a optimal solution. Selection of one or more
kernels is to be adjusted and one or more support vector machines is to be
retrained and retested. When it is determined that an optimal solution has
been achieved, live data is pre-processed and input into the support
vector machine comprising the kernel that produced the optimal solution.
The live output from the learning machine is post-processed into a
computationally derived alphanumerical classifier for interpretation by a
human or computer automated process.
Un sistema y un método para realzar descubrimiento del conocimiento de datos usando las máquinas que aprenden múltiples en máquinas del vector de la ayuda general y múltiple en detalle. Los datos de entrenamiento para una máquina que aprende son preprocesados para agregar significar además. Los datos que preprocesan implican el transformar de los puntos y/o de ampliar de referencias los puntos de referencias. Agregando el significado a los datos, la máquina que aprende es proporcionada una mayor cantidad de información para procesar. Con respecto a las máquinas del vector de la ayuda en detalle, cuanto mayor es la cantidad de información que se procesa, mejores las generalizaciones sobre los datos derivados. Las máquinas del vector de la ayuda múltiple, cada los núcleos distintos que abarcan, se entrenan con los datos preprocesados del entrenamiento y se prueban con los datos de prueba que son preprocesados de manera semejante. Las salidas de la prueba de las máquinas del vector de la ayuda múltiple se comparan para determinarse cuáles de las salidas de la prueba si cualquiera representa una solución óptima. La selección de unos o más núcleos debe ser ajustada y unas o más máquinas del vector de la ayuda deben ser enseñadas /ser aprendidas habilidades nuevas y ser reexaminadas. Cuando se determina que se ha alcanzado una solución óptima, los datos vivos son preprocesados y entrada en la máquina del vector de la ayuda que abarca el núcleo que produjo la solución óptima. La salida viva de la máquina que aprende es postprocesada en un clasificador alfanumérico de cómputo derivado para la interpretación por un ser humano o un proceso automatizado computadora.