A method for learning signatures of a target class using a sequential
covering phased rule-induction. The method balances recall and precision
for the target class. A first phase aims for high recall by inducing rules
with high support and a reasonable level of accuracy. A second phase
improves the precision by learning rules to remove false positives in the
collection of the records covered by the first phase rules, while keeping
the overall recall at a desirable level. The method constructs a mechanism
to assign prediction probability scores to each classification decision.
The model includes a set of positive rules that predict presence of the
target class, a set of negative rules that predict absence of the target
class, and a set of prediction score values corresponding to each
pair-wise combination of positive and negative rules. The two-phase method
is extensible to a multiphase approach.
Μια μέθοδος για τις υπογραφές εκμάθησης μιας κατηγορίας στόχων που χρησιμοποιεί μια διαδοχική κάλυψη συγχρόνισε την κανόνας-επαγωγή. Οι ισορροπίες μεθόδου θυμούνται και ακρίβεια για την κατηγορία στόχων. Οι στόχοι μιας πρώτης φάσης για την υψηλή ανάκληση με την πρόκληση κυβερνούν με την υψηλή υποστήριξη και ένα λογικό επίπεδο ακρίβειας. Μια δεύτερη φάση βελτιώνει την ακρίβεια με την εκμάθηση των κανόνων για να αφαιρεθούν τα ψεύτικα θετικά στη συλλογή των αρχείων που καλύπτονται από τους κανόνες πρώτης φάσης, κρατώντας τη γενική ανάκληση σε επιθυμητό επίπεδο. Η μέθοδος κατασκευάζει έναν μηχανισμό για να ορίσει τα αποτελέσματα πιθανότητας πρόβλεψης σε κάθε απόφαση ταξινόμησης. Το πρότυπο περιλαμβάνει ένα σύνολο θετικών κανόνων που προβλέπουν την παρουσία της κατηγορίας στόχων, ένα σύνολο αρνητικών κανόνων που προβλέπουν την απουσία της κατηγορίας στόχων, και ένα σύνολο τιμών αποτελέσματος πρόβλεψης που αντιστοιχούν σε κάθε pair-wise συνδυασμό θετικών και αρνητικών κανόνων. Η διφασική μέθοδος είναι εκτατή σε μια πολυφασική προσέγγιση.