A method and apparatus for normalizing a score associated with a document
is presented. Statistics relating to scores assigned to a set of training
documents not relevant to a topic arc determined. Scores represent a
measure of relevance to the topic. After the various statistics have been
collected, a score assigned to a testing document is normalized based on
those statistics. The normalized score is then compared to a threshold
score. Subsequently, the testing document is designated as relevant or not
relevant to the topic based on the comparison.
Eine Methode und ein Apparat für das Normalisieren einer Kerbe, die mit einem Dokument verbunden ist, wird dargestellt. Statistiken in bezug auf sind die Kerben zugewiesen einem Satz Training Dokumenten nicht relevant zu einem Themabogen festgestellt. Kerben stellen ein Maß Bedeutung zum Thema dar. Nachdem die verschiedenen Statistiken gesammelt worden sind, wird eine Kerbe, die einem prüfendokument zugewiesen wird, gründete auf jenen Statistiken normalisiert. Die normalisierte Kerbe wird dann mit einer Schwelle Kerbe verglichen. Nachher wird das prüfendokument als relevantes oder nicht relevantes zum Thema gekennzeichnet, das auf dem Vergleich basiert.