A method and system for dynamically selecting words for training a speech
recognition system. The speech recognition system models each phoneme
using a hidden Markov model and represents each word as a sequence of
phonemes. The training system ranks each phoneme for each frame according
to the probability that the corresponding codeword will be spoken as part
of the phoneme. The training system collects spoken utterances for which
the corresponding word is known. The training system then aligns the
codewords of each utterance with the phoneme that it is recognized to be
part of. The training system then calculates an average rank for each
phoneme using the aligned codewords for the aligned frames. Finally, the
training system selects words for training that contain phonemes with a
low rank.
Um método e um sistema para dinâmicamente selecionar palavras para treinar um sistema do recognition de discurso. Os modelos de sistema do recognition de discurso cada fonema usando um modelo escondido de Markov e representam cada palavra como uma seqüência dos fonemas. O sistema do treinamento espesso cada fonema para cada frame de acordo com a probabilidade que o codeword correspondente estêve falado como a parte do fonema. O sistema do treinamento coleta os utterances falados para que a palavra correspondente é sabida. O sistema do treinamento alinha então os codewords de cada utterance com o fonema que se reconhece para ser parte de. O sistema do treinamento calcula então um Rank médio para cada fonema usando os codewords alinhados para os frames alinhados. Finalmente, o sistema do treinamento seleciona as palavras para o treinamento que contêm fonemas com um Rank baixo.