A language-independent speaker-recognition system based on parallel
cumulative differences in dynamic realization of phonetic features ( i.e.
, pronunciation) between speakers rather than spectral differences in
voice quality. The system exploits phonetic information from many phone
recognizers to perform text independent speaker recognition. A digitized
speech signal from a speaker is converted to a sequence of phones by each
phone recognizer. Each phone sequence is then modified based on the energy
in the signal. The modified phone sequences are tokenized to produce phone
n-grams that are compared against a speaker and a background model for
each phone recognizer to produce log-likelihood ratio scores. The
log-likelihood ratio scores from each phone recognizer are fused to
produce a final recognition score for each speaker model. The recognition
score for each speaker model is then evaluated to determine which of the
modeled speakers, if any, produced the digitized speech signal.
Un sistema language-independent di altoparlante-riconoscimento basato sulle differenze cumulative parallele nella realizzazione dinamica delle caratteristiche fonetiche (cioè. , pronuncia) fra gli altoparlanti piuttosto che differenze spettrali nella qualità di voce. Il sistema sfrutta le informazioni fonetiche da molti riconoscitori del telefono per effettuare il riconoscimento indipendente dell'altoparlante del testo. Un segnale di discorso dato valori numerici a da un altoparlante è convertito in sequenza dei telefoni da ogni riconoscitore del telefono. Ogni sequenza del telefono allora è modificata basata sull'energia nel segnale. Le sequenze modificate del telefono sono tokenized per produrre i n-grammi del telefono che sono confrontati contro un altoparlante e un modello della priorità bassa affinchè ogni riconoscitore del telefono producano i segni di rapporto di ceppo-probabilità. I segni di rapporto di ceppo-probabilità da ogni riconoscitore del telefono sono fusi per produrre un segno finale di riconoscimento per ogni modello dell'altoparlante. Il segno di riconoscimento per ogni modello dell'altoparlante allora è valutato per determinare quale degli altoparlanti modellistici, all'occorrenza, prodotti il segnale di discorso dato valori numerici a.