The present invention is a method for operating a computer system to minimize the number of disk storage access operations used in creating an inverted database. This method divides a database into several smaller subdatabases. The documents of the subdatabases are decomposed into subdocuments. A postings list for each subdatabase is then created in which all the terms for the subdatabase are associated with the identity of each subdocument of the subdatabase in which the terms occur. The resulting postings lists for the subdatabases are then merged. The merge process sorts the postings of the subdatabases and merges common terms. The non-common terms are merged after the common terms. The process of sorting the postings list and then merging the common terms followed by the non-common terms minimizes the number of disk storage access operations required for creating the inverted database from a series of inverted subdatabases.

Присытствыющим вымыслом будет метод для работать систему компьютера для того чтобы уменьшить число деятельностей доступа запоминающего устройства используемых в создавать перевернутую базу данных. Этот метод разделяет базу данных в несколько более малых subdatabases. Документы subdatabases разложены в subdocuments. Postings перечисляют для каждого subdatabase после этого созданы в все термины для subdatabase связаны с тождественностью каждого subdocument subdatabase в термины происходят. Приводя к списки postings для subdatabases после этого слиты. Процесс слияния сортирует postings subdatabases и сливает общие термины. Нон-ob5ie термины слиты после общих термин. Процесс сортировать postings перечисляет и после этого сливать общие термины последованные за нон-ob5imi терминами уменьшает число деятельностей доступа запоминающего устройства необходимо для создавать перевернутую базу данных от серии перевернутых subdatabases.

 
Web www.patentalert.com

< Server integrated system and methods for processing precomputed views

< Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction

> Method and system for processing queries in a data processing system using index

> Internet document management system and methods

~ 00061