A system includes means for creating a vocabulary and/or statistical
language model from a textual training corpus. The vocabulary and/or
language model are used in a pattern recognition system, such as a speech
recognition system or a handwriting recognition system, for recognizing a
time-sequential input pattern. The system includes means for determining
at least one context identifier and means for deriving at least one search
criterion, such as a keyword, from the context identifier. The system
further includes means for selecting documents from a set of documents
based on the search criterion. Advantageously, an Internet search engine
is used for selecting the documents. Means are used for composing the
training corpus from the selected documents.
Система вклюает середины для создавать терминологию and/or статистически модель языка от текстуального corpus тренировки. Модель терминологии and/or языка использована в системе распознавания по образцу, such as система опознавания речи или система опознавания почерка, для узнавать врем-posledovatel6nuh картину входного сигнала. Система вклюает середины для обусловливать по крайней мере одно обозначение смысла и середины для выводить по крайней мере одну критерю по поиска, such as keyword, от обозначения смысла. Система более дальнейшая вклюает середины для выбирать документы от комплекта документов основанные на критери по поиска. Выгодн, двигатель поиска интернета использован для выбирать документы. Середины использованы для составлять corpus тренировки от выбранных документов.