A method for collecting data associated with the voice of a voice system
user includes conducting a plurality of conversations with a plurality of
voice system users. For each conversation, a speech waveform is captured
and digitized, and at least one acoustic feature is extracted. The
features are correlated with at least one attribute such as gender, age,
accent, native language, dialect, socioeconomic classification,
educational level and emotional state. Attribute data and at least one
identifying indicia are stored for each user in a data warehouse, in a
form to facilitate subsequent data mining thereon. The resulting
collection of stored data is then mined to provide information for
modifying underlying business logic of the voice system. An apparatus
suitable for carrying out the method includes a dialog management unit, an
audio capture module, an acoustic from end, a processing module and a data
warehouse. Appropriate method steps can be implemented by a digital
computer running a suitable program stored on a program storage device.
Un método para recoger datos se asoció a la voz de un usuario del sistema de la voz incluye conducir una pluralidad de conversaciones con una pluralidad de usuarios del sistema de la voz. Para cada conversación, se captura y se convierte a digital una forma de onda del discurso, y por lo menos se extrae una característica acústica. Las características se correlacionan con por lo menos una cualidad tal como género, edad, acento, lengua materna, dialecto, clasificación socioeconómica, nivel de enseñanza y estado emocional. Los datos de la cualidad y por lo menos un indicia que identifica se almacenan para cada usuario en un almacén de los datos, en una forma para facilitar los datos subsecuentes que minan sobre eso. La colección que resulta de datos almacenados entonces se mina para proporcionar la información para la lógica subyacente de modificación del negocio del sistema de la voz. Un aparato conveniente para realizar el método incluye una unidad de la gerencia del diálogo, un módulo audio de la captura, un acústico de extremo, un módulo de proceso y un almacén de los datos. Los pasos apropiados del método se pueden poner en ejecucio'n por una calculadora numérica que funciona un programa conveniente almacenado en un dispositivo de almacenaje del programa.