Method of and device for phone-based speaker recognition

A language-independent speaker-recognition system based on parallel cumulative differences in dynamic realization of phonetic features ( i.e. , pronunciation) between speakers rather than spectral differences in voice quality. The system exploits phonetic information from many phone recognizers to perform text independent speaker recognition. A digitized speech signal from a speaker is converted to a sequence of phones by each phone recognizer. Each phone sequence is then modified based on the energy in the signal. The modified phone sequences are tokenized to produce phone n-grams that are compared against a speaker and a background model for each phone recognizer to produce log-likelihood ratio scores. The log-likelihood ratio scores from each phone recognizer are fused to produce a final recognition score for each speaker model. The recognition score for each speaker model is then evaluated to determine which of the modeled speakers, if any, produced the digitized speech signal.
Un sistema language-independent di altoparlante-riconoscimento basato sulle differenze cumulative parallele nella realizzazione dinamica delle caratteristiche fonetiche (cioè. , pronuncia) fra gli altoparlanti piuttosto che differenze spettrali nella qualità di voce. Il sistema sfrutta le informazioni fonetiche da molti riconoscitori del telefono per effettuare il riconoscimento indipendente dell'altoparlante del testo. Un segnale di discorso dato valori numerici a da un altoparlante è convertito in sequenza dei telefoni da ogni riconoscitore del telefono. Ogni sequenza del telefono allora è modificata basata sull'energia nel segnale. Le sequenze modificate del telefono sono tokenized per produrre i n-grammi del telefono che sono confrontati contro un altoparlante e un modello della priorità bassa affinchè ogni riconoscitore del telefono producano i segni di rapporto di ceppo-probabilità. I segni di rapporto di ceppo-probabilità da ogni riconoscitore del telefono sono fusi per produrre un segno finale di riconoscimento per ogni modello dell'altoparlante. Il segno di riconoscimento per ogni modello dell'altoparlante allora è valutato per determinare quale degli altoparlanti modellistici, all'occorrenza, prodotti il segnale di discorso dato valori numerici a.

Web www.patentalert.com

< (none)

< Interface to a speech processing system

> Distinctive ringing in a wireless centrex system

> (none)

~ 00084