A novel approach for filtering documents involves the use of delivery ratio threshold setting technique to set an initial profile score threshold and the use of beta-gamma regulation for dynamic threshold updating. A group of documents is scored pursuant to a user profile. The score for each document is indicative of the relevance of the corresponding document to the user profile. The score can be compared with a profile score threshold to decide if the document should be accepted or rejected. According to one aspect of the invention, the initial threshold is set to a score threshold that approximates an expected ratio of acceptable documents calibrated with respect to a set of reference documents. According to another aspect of the invention, the score threshold can be updated based on the accumulated example documents, user's relevance judgment, and the user's utility function. The accumulated example documents are first scored against a profile and a ranked list of scored documents is obtained. Each position at the ranked list corresponds to a candidate score threshold as well as a utility value computed based on the relevance status of the example documents. From these candidate threshold points, an optimal utility threshold and a zero utility threshold are determined. Using the optimal utility threshold and the zero utility threshold, a new utility threshold is calculated by interpolating between estimates of the optimal utility threshold and the zero utility threshold. This new utility threshold is used for subsequent information retrieval and filtering.

Een nieuwe benadering voor het filtreren van documenten impliceert het gebruik van leveringsverhouding drempel plaatsende techniek om een eerste drempel van de profielscore te plaatsen en het gebruik van bèta-gammaregelgeving voor het dynamische drempel bijwerken. Een groep documenten wordt genoteerd overeenkomstig een gebruikersprofiel. De score voor elk document is indicatief van de relevantie van het overeenkomstige document voor het gebruikersprofiel. De score kan met een drempel van de profielscore worden vergeleken om te beslissen als het document zou moeten worden goedgekeurd of worden verworpen. Volgens één aspect van de uitvinding, wordt de aanvankelijke drempel geplaatst aan een scoredrempel die een verwachte verhouding van aanvaardbare documenten benadert die met betrekking tot een reeks verwijzingsdocumenten worden gekalibreerd. Volgens een ander aspect van de uitvinding, kan de scoredrempel worden bijgewerkt gebaseerd op de geaccumuleerde voorbeelddocumenten, de relevantieoordeel van de gebruiker, en de het nutsfunctie van de gebruiker. De geaccumuleerde voorbeelddocumenten worden eerst genoteerd tegen een profiel en een gerangschikte lijst van genoteerde documenten wordt verkregen. Elke positie bij de gerangschikte lijst beantwoordt aan een kandidaatscoredrempel evenals een gegevens verwerkt nutswaarde die op de relevantiestatus wordt gebaseerd van de voorbeelddocumenten. Van deze kandidaatdrempelpunten, worden een optimale nutsdrempel en een nul nutsdrempel bepaald. Gebruikend de optimale nutsdrempel en de nul nutsdrempel, wordt een nieuwe nutsdrempel berekend door tussen ramingen van de optimale nutsdrempel en de nul nutsdrempel te interpoleren. Deze nieuwe nutsdrempel wordt gebruikt voor het verdere informatieherwinning en filtreren.

