A three phase process and system is disclosed for automatically and
adaptively filtering and classifying electronic text-based messages, such
as e-mail, e-commerce transactions, CGI forms, and optically scanned and
textualized written and facsimile messages. In the first phase of
processing, the message is subjected to one or more feature extraction
methodologies. The output signals from the first phase are then clustered
in the second phase of processing using one or more clustering
methodologies. The second phase yields a suggested five characteristics of
the message: attitude, issue or problem, request, customer type, and
author education level. In the third phase, a human operator interface
presents the original message along with the proposed properties and
allows an operator to correct or tune the properties, and corrections and
tuning being fed back into the network of a feature extraction and
clustering methodologies. Finally, the architecture of the system is such
that feature extraction and clustering methodologies may be added,
updated, or removed in a module fashion to allow the system to be
customized to various applications and to allow the system to be
modernized as new algorithms become available.
Un proceso y el sistema de tres fases se divulga para automáticamente y adaptante filtrando y clasificando mensajes basados del texto electrónico, tales como E-mail, transacciones del e-comercio, el cgi forma, y ópticamente explorado y textualized los mensajes escrito y del facsímil. En la primera fase del proceso, el mensaje se sujeta a uno o más las metodologías de la extracción de la característica. Las señales de salida a partir de la primera fase entonces se arraciman en la segunda fase del proceso usando unas o más metodologías que arraciman. La segunda fase rinde las cinco características sugeridas del mensaje: actitud, edición o problema, petición, tipo del cliente, y nivel de la educación del autor. En la tercera fase, un interfaz del operador humano presenta el mensaje original junto con las características propuestas y permite que un operador corrija o temple las características, y la retroacción de las correcciones y el templar en la red de una extracción de la característica y de metodologías que arraciman. Finalmente, la arquitectura del sistema es tal que la extracción de la característica y las metodologías que arraciman se pueden agregar, puesto al día, o quitado en una manera del módulo para permitir el sistema sea modificado para requisitos particulares a los varios usos y para permitir que el sistema sea modernizado como nuevos algoritmos llegan a estar disponibles.