Iterative information retrieval from a large database of textual or text-containing documents is facilitated by automatic construction of faceted representations. Facets are chosen heuristically based on lexical dispersion, a measure of the number of different words with which a particular search expression co-occurs within a given type of lexical construct (e.g., a noun phrase) appearing in the document set. Words having high dispersion rates represent "facets" that may be used to organize the documents conceptually in accordance with the search expression, effectively providing a concise, structured summary of the contents of a result set as well as presenting a set of candidate terms for query reformulation.

Итеративный поиска информации от большой базы данных текстуальных или текст-soderja документов облегчен автоматической конструкцией граненных представлений. Фасетки выбраны heuristically основали на словарном рассеивании, измерении числа по-разному слов с которыми определенное выражение поиска чо-proisxodit внутри, котор дали тип словарной стройки (например, фразы существительного) появляясь в комплекта документов. Слова имея высокие тарифы рассеивания представляют "фасетки" могут быть использованы для того чтобы организовать документы схематически в соответствии с выражением поиска, эффективно обеспечивая сжатую, составленную сводку содержания результата установленного так же, как представляющ комплект выбранного термин для переформулирования query.

 
Web www.patentalert.com

< Character recognition system

< System and method for building an executable script for performing a network security audit

> Nematode-extracted serine protease inhibitors and anticoagulant proteins

> System and method for control of access to resources

~ 00060