The present invention is a method for operating a computer system to
minimize the number of disk storage access operations used in creating an
inverted database. This method divides a database into several smaller
subdatabases. The documents of the subdatabases are decomposed into
subdocuments. A postings list for each subdatabase is then created in
which all the terms for the subdatabase are associated with the identity
of each subdocument of the subdatabase in which the terms occur. The
resulting postings lists for the subdatabases are then merged. The merge
process sorts the postings of the subdatabases and merges common terms.
The non-common terms are merged after the common terms. The process of
sorting the postings list and then merging the common terms followed by
the non-common terms minimizes the number of disk storage access
operations required for creating the inverted database from a series of
inverted subdatabases.
Присытствыющим вымыслом будет метод для работать систему компьютера для того чтобы уменьшить число деятельностей доступа запоминающего устройства используемых в создавать перевернутую базу данных. Этот метод разделяет базу данных в несколько более малых subdatabases. Документы subdatabases разложены в subdocuments. Postings перечисляют для каждого subdatabase после этого созданы в все термины для subdatabase связаны с тождественностью каждого subdocument subdatabase в термины происходят. Приводя к списки postings для subdatabases после этого слиты. Процесс слияния сортирует postings subdatabases и сливает общие термины. Нон-ob5ie термины слиты после общих термин. Процесс сортировать postings перечисляет и после этого сливать общие термины последованные за нон-ob5imi терминами уменьшает число деятельностей доступа запоминающего устройства необходимо для создавать перевернутую базу данных от серии перевернутых subdatabases.