A method and apparatus are provided for automatically recognizing words of
spoken speech using a computer-based speech recognition system according
to a dynamic semantic model. In an embodiment, the speech recognition
system recognizes speech and generates one or more word strings, each of
which is a hypothesis of the speech, and creates and stores a probability
value or score for each of the word strings. The word strings are ordered
by probability value. The speech recognition system also creates and
stores, for each of the word strings, one or more keyword-value pairs that
represent semantic elements and semantic values of the semantic elements
for the speech that was spoken. One or more dynamic semantic rules are
defined that specify how a probability value of a word string should be
modified based on information about external conditions, facts, or the
environment of the application in relation to the semantic values of that
word string. A speech recognition application, upon receiving the
keyword-value pairs, instructs the speech recognizer to modify one or more
of the probability values, according to the dynamic semantic rules. The
dynamic semantic rules are applied to the word strings and the
keyword-value pairs. The speech recognizer modifies one or more of the
probability values, re-orders the word strings, and returns control to the
application. As a result, the speech recognizer may adjust dynamically to
a changing likelihood that a speaker uttered a particular utterance, as
the application executes, depending on the context of the application and
the external factors.
Un método y un aparato se proporcionan para automáticamente reconocer palabras del discurso hablado usando un sistema computarizado del reconocimiento de discurso según un modelo semántico dinámico. En una encarnación, el sistema del reconocimiento de discurso reconoce discurso y genera unas o más secuencias de la palabra, cada uno de las cuales es una hipótesis del discurso, y crea y almacena un valor o una cuenta de la probabilidad para cada uno de las secuencias de la palabra. Las secuencias de la palabra son pedidas por valor de la probabilidad. El sistema del reconocimiento de discurso también crea y almacena, para cada uno de las secuencias de la palabra, unos o más pares del palabra-valor que representen elementos semánticos y valores semánticos de los elementos semánticos para el discurso que fue hablado. Se definen unas o más reglas semánticas dinámicas que especifican cómo un valor de la probabilidad de una secuencia de la palabra se debe modificar basó en la información sobre condiciones externas, los hechos, o el ambiente del uso en lo referente a los valores semánticos de esa secuencia de la palabra. Un uso del reconocimiento de discurso, sobre la recepción de los pares del palabra-valor, manda al reconocedor del discurso modificar uno o más de los valores de la probabilidad, según las reglas semánticas dinámicas. Las reglas semánticas dinámicas se aplican a las secuencias de la palabra y a los pares del palabra-valor. El reconocedor del discurso modifica uno o más de los valores de la probabilidad, reordena las secuencias de la palabra, y vuelve control al uso. Consecuentemente, el reconocedor del discurso puede ajustar dinámicamente a una probabilidad que cambia que un altavoz pronunció una elocución particular, mientras que el uso se ejecuta, dependiendo del contexto del uso y de los factores externos.