A web-based voice dialog interface for use in communicating dialog
information between a user at a client machine and one or more servers
coupled to the client machine via the Internet or other computer network.
The interface in an illustrative embodiment includes a web page
interpreter for receiving information relating to one or more web pages.
The web page interpreter generates a rendering of at least a portion of
the information for presentation to a user in an audibly-perceptible
format. A grammar processing device utilizes interpreted web page
information received from the web page interpreter to generate syntax
information and semantic information. A speech recognizer processes
received user speech in accordance with the syntax information, and a
natural language interpreter processes the resulting recognized speech in
accordance with the semantics information to generate output for delivery
to a web server in conjunction with a voice dialog which includes the user
speech and the rendering of the web page(s). The output may be processed
by a common gateway interface (CGI) formatter prior to delivery to a CGI
associated with the web server.
Un interfaz tela-basado del diálogo de la voz para el uso en la información del diálogo que se comunica entre un usuario en una máquina del cliente y unos o más servidores juntados a la máquina del cliente vía el Internet o la otra red de ordenadores. El interfaz en una encarnación ilustrativa incluye a intérprete del Web page para recibir la información referente a unos o más Web pages. El intérprete del Web page genera una representación por lo menos de una porción de la información para la presentación a un usuario en un formato audible-perceptible. Una gramática que procesa el dispositivo utiliza la información interpretada del Web page recibida del intérprete del Web page para generar la información del sintaxis y la información semántica. Un reconocedor del discurso procesa discurso recibido del usuario de acuerdo con la información del sintaxis, y un intérprete de la lengua natural procesa resultar reconoció discurso de acuerdo con la información de la semántica para generar la salida para la entrega a un web server conjuntamente con un diálogo de la voz que incluya el discurso del usuario y la representación del page(s) de la tela. La salida se puede procesar por un formateador del interfaz de entrada común (cgi) antes de la entrega a un cgi asociado al web server.