The present invention provides a method and apparatus for generating a
database search result. The creation of the search result is achieved by
representing the subdocument lists of an inverted database with encoded
bit strings. The encoded bit strings are space efficient methods of
storing the correspondence between terms in the database and their
occurrence in subdocuments. Logical combinations of these bit strings are
then obtained by identifying the intersection, union, and/or inversion of
a plurality of the bit strings. Since keywords for a database search can
be identified by selecting the terms of the inverted database, the logical
combinations of bit strings represent search results over the database.
This technique for method for generating a search result is
computationally efficient because computers combine bit strings very
efficiently. Also, the search elements of the present invention are not
just limited to keywords. The search elements also include types of fields
(e.g., date or integer fields) or other extracted entities.
De onderhavige uitvinding verstrekt een methode en een apparaat om een resultaat van de gegevensbankraadpleging te produceren. De verwezenlijking van het onderzoeksresultaat wordt bereikt door de subdocumentlijsten van een omgekeerd gegevensbestand met gecodeerde beetjekoorden te vertegenwoordigen. De gecodeerde beetjekoorden zijn ruimte efficiënte methodes om de correspondentie tussen termijnen in het gegevensbestand en hun voorkomen in subdocumenten op te slaan. De logische combinaties deze beetjekoorden worden dan verkregen door de kruising, de unie, en/of de inversie van een meerderheid van de beetjekoorden te identificeren. Aangezien de sleutelwoorden voor een gegevensbankraadpleging kunnen worden geïdentificeerd door de termijnen van het omgekeerde gegevensbestand te selecteren, vertegenwoordigen de logische combinaties beetjekoorden onderzoeksresultaten over het gegevensbestand. Deze techniek voor methode om een onderzoeksresultaat te produceren is met behulp van computer efficiënt omdat de computers beetjekoorden zeer efficiënt combineren. Ook, zijn de onderzoekselementen van de onderhavige uitvinding niet alleen beperkt tot sleutelwoorden. De onderzoekselementen omvatten ook types van gebieden (b.v., datum of geheelgebieden) of andere gehaalde entiteiten.