A language model is used in a speech recognition system which has access to
a first, smaller data store and a second, larger data store. The language
model is adapted by formulating an information retrieval query based on
information contained in the first data store and querying the second data
store. Information retrieved from the second data store is used in
adapting the language model. Also, language models are used in retrieving
information from the second data store. Language models are built based on
information in the first data store, and based on information in the
second data store. The perplexity of a document in the second data store
is determined, given the first language model, and given the second
language model. Relevancy of the document is determined based upon the
first and second perplexities. Documents are retrieved which have a
relevancy measure that exceeds a threshold level.
Un modelo de la lengua se utiliza en un sistema del reconocimiento de discurso que tenga acceso a un primer, un almacén más pequeño y un segundo, un almacén más grande de los datos de los datos. El modelo de la lengua es adaptado formulando una pregunta de la recuperación de datos basada en la información contenida en el primer almacén de los datos y preguntando el segundo almacén de los datos. La información recuperada del segundo almacén de los datos se utiliza en adaptar el modelo de la lengua. También, los modelos de la lengua se utilizan en el recuperación de la información del segundo almacén de los datos. Se construyen los modelos de la lengua basaron en la información en el primer almacén de los datos, y basado en la información en el segundo almacén de los datos. La perplejidad de un documento en el segundo almacén de los datos se determina, se da el primer modelo de la lengua, y se da el segundo modelo de la lengua. La importancia del documento se determina basó sobre las primeras y segundas perplejidades. Se recuperan los documentos que tienen una medida de la importancia que exceda un límite de alarma.