System and method for real-time detection and preservation of speech onset in a signal

   
   

A "speech onset detector" provides a variable length frame buffer in combination with either variable transmission rate or temporal speech compression for buffered signal frames. The variable length buffer buffers frames that are not clearly identified as either speech or non-speech frames during an initial analysis. Buffering of signal frames continues until a current frame is identified as either speech or non-speech. If the current frame is identified as non-speech, buffered frames are encoded as non-speech frames. However, if the current frame is identified as a speech frame, buffered frames are searched for the actual onset point of the speech. Once that onset point is identified, the signal is either transmitted in a burst, or a time-scale modification of the buffered signal is applied for compressing buffered frames beginning with the frame in which onset point is detected. The compressed frames are then encoded as one or more speech frames.

Do "um detetor do início discurso" fornece um amortecedor de frame do comprimento variável em combinação com a taxa variável da transmissão ou a compressão de discurso temporal para frames protegidos do sinal. O amortecedor do comprimento variável protege os frames que não são identificados claramente como frames do discurso ou do non-discurso durante uma análise inicial. O buffering de frames do sinal continua até que um frame atual esteja identificado como o discurso ou o non-discurso. Se o frame atual for identificado como o non-discurso, os frames protegidos estão codificados como frames do non-discurso. Entretanto, se o frame atual for identificado como um frame do discurso, os frames protegidos são procurarados pelo ponto real do início do discurso. Uma vez que esse ponto do início é identificado, o sinal ou está transmitido em um estouro, ou uma modificação time-scale do sinal protegido é aplicada comprimindo os frames protegidos que começam com o frame em que o ponto do início é detectado. Os frames comprimidos são codificados então como um ou mais frame do discurso.

 
Web www.patentalert.com

< System and method for the logical substitution of processor control in an emulated computing environment

< Computer-aided reading system and method with cross-language reading wizard

> System and method for providing high-quality stretching and compression of a digital audio signal

> Audio watermarking with dual watermarks

~ 00167