A speech-enabled distributed processing system forming a Voice Web includes
a gateway, one or more voice content sites coupled to the gateway over a
wide area network, and a browser coupled to the gateway over a network,
which may or may not be the wide area network. The gateway receives
telephone calls from one or more users over telephony connections and
performs endpointing of speech of each user. The browser provides the
gateway with information enabling the gateway to selectively direct the
endpointed speech to a voice content site via the wide area network. The
gateway outputs the endpointed speech in the form of application protocol
requests onto the wide area network to the appropriate site, as specified
by the browser, or to the browser. The gateway receives prompts in the
form of application protocol responses from the browser or a voice content
site and plays the prompts to the appropriate user over the telephony
connection. While accessing a selected voice content site, the gateway
reroutes the endpointed speech to the browser if the endpointing result
represents a hotword candidate.
Un système discours-permis de traitement distribué formant un Web de voix inclut un passage, un ou plusieurs les emplacements contents de voix couplés au passage au-dessus d'un réseau étendu, et un navigateur couplé au passage au-dessus d'un réseau, qui peut ou peut ne pas être le réseau étendu. Le passage reçoit les appels téléphoniques d'un ou plusieurs utilisateurs au-dessus des raccordements de téléphonie et exécute endpointing du discours de chaque utilisateur. Le navigateur fournit au passage l'information permettant au passage de diriger sélectivement endpointed la parole à un emplacement de contenu de voix par l'intermédiaire du réseau étendu. Le passage produit endpointed la parole sous forme de demandes de protocole d'application sur le réseau étendu à l'emplacement approprié, comme indiqué par le navigateur, ou au navigateur. Le passage reçoit des messages de sollicitation sous forme de réponses de protocole d'application du navigateur ou d'un emplacement de contenu de voix et joue les messages de sollicitation à l'utilisateur approprié au-dessus du raccordement de téléphonie. Tout en accédant à un emplacement choisi de contenu de voix, le passage rechemine endpointed la parole au navigateur si le résultat endpointing représente un candidat de hotword.