Dynamic semantic control of a speech recognition system

A method and apparatus are provided for automatically recognizing words of spoken speech using a computer-based speech recognition system according to a dynamic semantic model. In an embodiment, the speech recognition system recognizes speech and generates one or more word strings, each of which is a hypothesis of the speech, and creates and stores a probability value or score for each of the word strings. The word strings are ordered by probability value. The speech recognition system also creates and stores, for each of the word strings, one or more keyword-value pairs that represent semantic elements and semantic values of the semantic elements for the speech that was spoken. One or more dynamic semantic rules are defined that specify how a probability value of a word string should be modified based on information about external conditions, facts, or the environment of the application in relation to the semantic values of that word string. A speech recognition application, upon receiving the keyword-value pairs, instructs the speech recognizer to modify one or more of the probability values, according to the dynamic semantic rules. The dynamic semantic rules are applied to the word strings and the keyword-value pairs. The speech recognizer modifies one or more of the probability values, re-orders the word strings, and returns control to the application. As a result, the speech recognizer may adjust dynamically to a changing likelihood that a speaker uttered a particular utterance, as the application executes, depending on the context of the application and the external factors.
Un método y un aparato se proporcionan para automáticamente reconocer palabras del discurso hablado usando un sistema computarizado del reconocimiento de discurso según un modelo semántico dinámico. En una encarnación, el sistema del reconocimiento de discurso reconoce discurso y genera unas o más secuencias de la palabra, cada uno de las cuales es una hipótesis del discurso, y crea y almacena un valor o una cuenta de la probabilidad para cada uno de las secuencias de la palabra. Las secuencias de la palabra son pedidas por valor de la probabilidad. El sistema del reconocimiento de discurso también crea y almacena, para cada uno de las secuencias de la palabra, unos o más pares del palabra-valor que representen elementos semánticos y valores semánticos de los elementos semánticos para el discurso que fue hablado. Se definen unas o más reglas semánticas dinámicas que especifican cómo un valor de la probabilidad de una secuencia de la palabra se debe modificar basó en la información sobre condiciones externas, los hechos, o el ambiente del uso en lo referente a los valores semánticos de esa secuencia de la palabra. Un uso del reconocimiento de discurso, sobre la recepción de los pares del palabra-valor, manda al reconocedor del discurso modificar uno o más de los valores de la probabilidad, según las reglas semánticas dinámicas. Las reglas semánticas dinámicas se aplican a las secuencias de la palabra y a los pares del palabra-valor. El reconocedor del discurso modifica uno o más de los valores de la probabilidad, reordena las secuencias de la palabra, y vuelve control al uso. Consecuentemente, el reconocedor del discurso puede ajustar dinámicamente a una probabilidad que cambia que un altavoz pronunció una elocución particular, mientras que el uso se ejecuta, dependiendo del contexto del uso y de los factores externos.

Web www.patentalert.com

< Statistical computing and reporting for interactive speech applications

< Voice-activated control for electrical device

> Load-adjusted speech recogintion

> Method and apparatus for providing active help to a user of a voice-enabled application

~ 00060