A method and apparatus for normalizing a score associated with a document is presented. Statistics relating to scores assigned to a set of training documents not relevant to a topic arc determined. Scores represent a measure of relevance to the topic. After the various statistics have been collected, a score assigned to a testing document is normalized based on those statistics. The normalized score is then compared to a threshold score. Subsequently, the testing document is designated as relevant or not relevant to the topic based on the comparison.

Eine Methode und ein Apparat für das Normalisieren einer Kerbe, die mit einem Dokument verbunden ist, wird dargestellt. Statistiken in bezug auf sind die Kerben zugewiesen einem Satz Training Dokumenten nicht relevant zu einem Themabogen festgestellt. Kerben stellen ein Maß Bedeutung zum Thema dar. Nachdem die verschiedenen Statistiken gesammelt worden sind, wird eine Kerbe, die einem prüfendokument zugewiesen wird, gründete auf jenen Statistiken normalisiert. Die normalisierte Kerbe wird dann mit einer Schwelle Kerbe verglichen. Nachher wird das prüfendokument als relevantes oder nicht relevantes zum Thema gekennzeichnet, das auf dem Vergleich basiert.

 
Web www.patentalert.com

< Method of optimally determining lossless joins

< Readership information delivery system for electronically distributed investment research

> System and method of automatic discovery of terms in a document that are relevant to a given target topic

> System and method for the automatic recognition of relevant terms by mining link annotations

~ 00091