A method for detecting incorrect categorization of data includes obtaining
a database containing a plurality of entry-category pairs, calculating a
score for each entry-category pair that corresponds to a likelihood that
the pair contains an incorrect category assignment, and verifying the
correctness of the assignment based on the score. The verification step
can be conducted manually. The score assists users in focusing any manual
verification efforts on data that may actually contain incorrect category
assignments, thereby making the verification process more efficient. The
method can be used to review and correct business name and phone number
listings in telephone directories.
Μια μέθοδος για την ανακριβή κατηγοριοποίηση των στοιχείων περιλαμβάνει τη λήψη μιας βάσης δεδομένων που περιέχει μια πολλαπλότητα των ζευγαριών είσοδος-κατηγορίας, υπολογίζοντας ένα αποτέλεσμα για κάθε ζευγάρι είσοδος-κατηγορίας που αντιστοιχεί σε μια πιθανότητα ότι το ζευγάρι περιέχει μια ανακριβή ανάθεση κατηγορίας, και επαλήθευση της ακρίβειας της ανάθεσης βασισμένης στο αποτέλεσμα. Το βήμα επαλήθευσης μπορεί να διευθυνθεί με το χέρι. Το αποτέλεσμα βοηθά τους χρήστες στη συγκέντρωση οποιωνδήποτε χειρωνακτικών προσπαθειών επαλήθευσης στα στοιχεία που μπορούν πραγματικά να περιέχουν τις ανακριβείς αναθέσεις κατηγορίας, με αυτόν τον τρόπο καθιστώντας τη διαδικασία επαλήθευσης αποδοτικότερη. Η μέθοδος μπορεί να χρησιμοποιηθεί για να αναθεωρήσει και να διορθώσει τις λίστες αριθμού επιχειρησιακού ονόματος και τηλεφώνων στους τηλεφωνικούς καταλόγους.