A text categorizer classifies a text object into one or more classes. The
text categorizer includes a pre-processing module, a knowledge base, and
an approximate reasoning module. The pre-processing module performs
feature extraction, feature reduction, and fuzzy set generation to
represent an unlabelled text object in terms of one or more fuzzy sets.
The approximate reasoning module uses a measured degree of match between
the one or more fuzzy set and categories represented by fuzzy rules in the
knowledge base to assign labels of those categories that satisfy a
selected decision making rule.
Een tekst categorizer classificeert een tekstvoorwerp in één of meerdere klassen. De tekst categorizer omvat een het voorbewerken module, een kennisbank, en een benaderende het redeneren module. De het voorbewerken module voert eigenschapextractie, eigenschapvermindering, en verwarde vastgestelde generatie uit om een tekstvoorwerp zonder etiket in termen van één of meerdere verwarde reeksen te vertegenwoordigen. De benaderende het redeneren module gebruikt een gemeten graad van gelijke tussen de één of meerdere verwarde reeks en de categorieën die door verwarde regels in de kennisbank wordt vertegenwoordigd om etiketten van die categorieën toe te wijzen die een geselecteerde besluitvormingsregel tevredenstellen.