An automated speech recognition system comprises a preprocessor, a speech
recognizer, and a task-independent utterance verifier. The task
independent utterance verifier employs a first subword acoustic Hidden
Markov Model for determining a first likelihood that a speech segment
contains a sound corresponding to a speech recognition hypothesis, and a
second anti-subword acoustic Hidden Markov Model for determining a second
likelihood that a speech segment contains a sound other than one
corresponding to the speech recognition hypothesis. In operation, the
utterance verifier employs the subword and anti-subword models to produce
for each recognized subword in the input speech the first and second
likelihoods. The utterance verifier determines a subword verification
score as the log of the ratio of the first and second likelihoods. In
order to verify larger speech units, the utterance verifier combines the
subword verification scores to produce a word/phrase/sentence verification
score, and compares that score to a predetermined threshold. The first and
second verification-specific HMMs are discriminatively trained using a
subword-based minimum verification error training technique.
Un sistema automatizzato di riconoscimento della parola contiene un preprocessore, un riconoscitore di discorso e una macchina verificatrice operazione-indipendente di espressione. La macchina verificatrice indipendente di espressione di operazione impiega un modello nascosto acustico di Markov di primo subword per la determinazione della prima probabilità che un segmento di discorso contiene un suono che corrisponde ad un'ipotesi di riconoscimento della parola e un modello nascosto acustico di Markov di secondo anti-subword per la determinazione della seconda probabilità che un segmento di discorso contiene un suono tranne uno che corrisponde all'ipotesi di riconoscimento della parola. In funzione, la macchina verificatrice di espressione impiega i modelli di anti-subword e di subword per produrre per ogni subword riconosciuto nel discorso dell'input i primi e secondi likelihoods. La macchina verificatrice di espressione determina un segno di verifica di subword come il ceppo del rapporto dei primi e secondi likelihoods. Per verificare le più grandi unità di discorso, i combines che della macchina verificatrice di espressione la verifica di subword nota per produrre un segno di verifica di word/phrase/sentence e confronta quel segno ad una soglia predeterminata. I primi e secondi verification-specifico HMMs discriminatively sono addestrati usando una tecnica minima subword-basata di addestramento di errore di verifica.