A novel approach for filtering documents involves the use of delivery ratio
threshold setting technique to set an initial profile score threshold and
the use of beta-gamma regulation for dynamic threshold updating. A group
of documents is scored pursuant to a user profile. The score for each
document is indicative of the relevance of the corresponding document to
the user profile. The score can be compared with a profile score threshold
to decide if the document should be accepted or rejected. According to one
aspect of the invention, the initial threshold is set to a score threshold
that approximates an expected ratio of acceptable documents calibrated
with respect to a set of reference documents. According to another aspect
of the invention, the score threshold can be updated based on the
accumulated example documents, user's relevance judgment, and the user's
utility function. The accumulated example documents are first scored
against a profile and a ranked list of scored documents is obtained. Each
position at the ranked list corresponds to a candidate score threshold as
well as a utility value computed based on the relevance status of the
example documents. From these candidate threshold points, an optimal
utility threshold and a zero utility threshold are determined. Using the
optimal utility threshold and the zero utility threshold, a new utility
threshold is calculated by interpolating between estimates of the optimal
utility threshold and the zero utility threshold. This new utility
threshold is used for subsequent information retrieval and filtering.
Een nieuwe benadering voor het filtreren van documenten impliceert het gebruik van leveringsverhouding drempel plaatsende techniek om een eerste drempel van de profielscore te plaatsen en het gebruik van bèta-gammaregelgeving voor het dynamische drempel bijwerken. Een groep documenten wordt genoteerd overeenkomstig een gebruikersprofiel. De score voor elk document is indicatief van de relevantie van het overeenkomstige document voor het gebruikersprofiel. De score kan met een drempel van de profielscore worden vergeleken om te beslissen als het document zou moeten worden goedgekeurd of worden verworpen. Volgens één aspect van de uitvinding, wordt de aanvankelijke drempel geplaatst aan een scoredrempel die een verwachte verhouding van aanvaardbare documenten benadert die met betrekking tot een reeks verwijzingsdocumenten worden gekalibreerd. Volgens een ander aspect van de uitvinding, kan de scoredrempel worden bijgewerkt gebaseerd op de geaccumuleerde voorbeelddocumenten, de relevantieoordeel van de gebruiker, en de het nutsfunctie van de gebruiker. De geaccumuleerde voorbeelddocumenten worden eerst genoteerd tegen een profiel en een gerangschikte lijst van genoteerde documenten wordt verkregen. Elke positie bij de gerangschikte lijst beantwoordt aan een kandidaatscoredrempel evenals een gegevens verwerkt nutswaarde die op de relevantiestatus wordt gebaseerd van de voorbeelddocumenten. Van deze kandidaatdrempelpunten, worden een optimale nutsdrempel en een nul nutsdrempel bepaald. Gebruikend de optimale nutsdrempel en de nul nutsdrempel, wordt een nieuwe nutsdrempel berekend door tussen ramingen van de optimale nutsdrempel en de nul nutsdrempel te interpoleren. Deze nieuwe nutsdrempel wordt gebruikt voor het verdere informatieherwinning en filtreren.