A real-time or streaming speech processing system and method is disclosed
with capabilities distributed between and client and a server where the
server may be reached via the Internet. The speech processing entails
digitizing and converting the utterances to features extracted to help the
processing. The features are sent via a communications channel to the
server where the recognition occurs. The features extracted allow low
bandwidth channels to be used with still maintaining real-time response.
The recognizer will determine the most likely text representing the
utterances and return the text to the client. The system can be used to
identify and/or verify who is speaking.
Un tiempo real o un sistema y un método de proceso del discurso que fluyen se divulga con las capacidades distribuidas en medio y cliente y un servidor donde el servidor se puede alcanzar vía el Internet. El proceso del discurso exige el convertir y el convertir de las elocuciones a digital a las características extraídas para ayudar al proceso. Las características se envían vía un canal de comunicaciones al servidor donde ocurre el reconocimiento. Las características extraídas permiten que los canales bajos de la anchura de banda sean utilizados con respuesta en tiempo real que mantiene inmóvil. El reconocedor determinará el texto más probable que representa las elocuciones y volverá el texto al cliente. El sistema se puede utilizar para identificar y/o para verificar quién está hablando.