A telephone-based interactive speech recognition system is retrained using
variable weighting and incremental retraining. Variable weighting involves
changing the relative influence of particular measurement data to be
reflected in a statistical model. Statistical model data is determined
based upon an initial set of measurement data determined from an initial
set of speech utterances. When new statistical model data is to be
generated to reflect new measurement data determined from new speech
utterances, a weighting factor is applied to the new measurement data to
generate weighted new measurement data. The new statistical model data is
then determined based upon the initial set of measurement data and the
weighted new measurement data. Incremental retraining involves generating
new statistical model data using prior statistical model data to reduce
the amount of prior measurement data that must be maintained and
processed. When prior statistical model data needs to be updated to
reflect characteristics and attributes of new speech utterances,
statistical model data is generated for the new speech utterances. Then
the prior statistical model data and the statistical model data for the
new measurement data are processed to generate the new statistical model
data.
Un système interactif téléphone-basé de reconnaissance de la parole est recyclé en utilisant peser variable et recyclage par accroissement. Peser variable implique de changer l'influence relative des données particulières de mesure à refléter dans un modèle statistique. Des données modèles statistiques sont déterminées ont basé sur un premier ensemble de données de mesure déterminées à partir d'un premier ensemble d'expressions de la parole. Quand de nouvelles données modèles statistiques doivent être produites pour refléter de nouvelles données de mesure déterminées à partir de nouvelles expressions de la parole, un facteur pesant est appliqué aux nouvelles données de mesure pour produire de nouvelles données pesées de mesure. Les nouvelles données modèles statistiques sont alors déterminées basées sur l'ensemble initial de données de mesure et des nouvelles données pesées de mesure. Le recyclage par accroissement implique de produire de nouvelles données modèles statistiques en utilisant des données modèles statistiques antérieures pour réduire la quantité de données antérieures de mesure qui doivent être maintenues et traitées. Quand des données modèles statistiques antérieures doivent être mises à jour pour refléter des caractéristiques et des attributs de nouvelles expressions de la parole, des données modèles statistiques sont produites pour les nouvelles expressions de la parole. Puis les données modèles statistiques antérieures et les données modèles statistiques pour les nouvelles données de mesure sont traitées pour produire des nouvelles données modèles statistiques.