Automatically retraining a speech recognition system

   
   

A telephone-based interactive speech recognition system is retrained using variable weighting and incremental retraining. Variable weighting involves changing the relative influence of particular measurement data to be reflected in a statistical model. Statistical model data is determined based upon an initial set of measurement data determined from an initial set of speech utterances. When new statistical model data is to be generated to reflect new measurement data determined from new speech utterances, a weighting factor is applied to the new measurement data to generate weighted new measurement data. The new statistical model data is then determined based upon the initial set of measurement data and the weighted new measurement data. Incremental retraining involves generating new statistical model data using prior statistical model data to reduce the amount of prior measurement data that must be maintained and processed. When prior statistical model data needs to be updated to reflect characteristics and attributes of new speech utterances, statistical model data is generated for the new speech utterances. Then the prior statistical model data and the statistical model data for the new measurement data are processed to generate the new statistical model data.

Un système interactif téléphone-basé de reconnaissance de la parole est recyclé en utilisant peser variable et recyclage par accroissement. Peser variable implique de changer l'influence relative des données particulières de mesure à refléter dans un modèle statistique. Des données modèles statistiques sont déterminées ont basé sur un premier ensemble de données de mesure déterminées à partir d'un premier ensemble d'expressions de la parole. Quand de nouvelles données modèles statistiques doivent être produites pour refléter de nouvelles données de mesure déterminées à partir de nouvelles expressions de la parole, un facteur pesant est appliqué aux nouvelles données de mesure pour produire de nouvelles données pesées de mesure. Les nouvelles données modèles statistiques sont alors déterminées basées sur l'ensemble initial de données de mesure et des nouvelles données pesées de mesure. Le recyclage par accroissement implique de produire de nouvelles données modèles statistiques en utilisant des données modèles statistiques antérieures pour réduire la quantité de données antérieures de mesure qui doivent être maintenues et traitées. Quand des données modèles statistiques antérieures doivent être mises à jour pour refléter des caractéristiques et des attributs de nouvelles expressions de la parole, des données modèles statistiques sont produites pour les nouvelles expressions de la parole. Puis les données modèles statistiques antérieures et les données modèles statistiques pour les nouvelles données de mesure sont traitées pour produire des nouvelles données modèles statistiques.

 
Web www.patentalert.com

< Recursively excited linear prediction speech coder

< Performing actions identified in recognized speech

> Adaptation of a speech recognition system across multiple remote sessions with a speaker

> System and method for providing and using universally accessible voice and speech data files

~ 00131