This invention relates to a method of recognizing input speech of many
unspecific people. Feature parameters representing both a short-time
average spectrum envelope characteristic of the input speech, and
regression coefficients obtained from the outputs from a wide-band filter
bank. The regression coefficients represent the rough directionality of
the characteristic of change in the spectrum of the speech signal.
Distance is measured between the feature parameters and standard patterns
stored in a storage means. The distance between the feature parameters and
the stored pattern which is smallest of all the patterns is found to
recognize said input speech.
Cette invention concerne une méthode d'identifier le discours d'entrée de beaucoup de personnes non spécifiques. Comportez les paramètres représentant une enveloppe moyenne à court terme de spectre caractéristique du discours d'entrée, et les coefficients de régression obtenus à partir des sorties d'une batterie de filtres à large bande. Les coefficients de régression représentent la directionnalité approximative de la caractéristique du changement du spectre du son articulé. La distance est mesurée entre les paramètres de dispositif et les modèles standard stockés dans des moyens d'un stockage. La distance entre les paramètres de dispositif et le modèle stocké qui est le plus petit de tous les modèles s'avère pour identifier ledit discours d'entrée.