An automatic text classification system is provided which extracts words
and word sequences from a text or texts to be analyzed. The extracted
words and word sequences are compared with training data comprising words
and word sequences together with a measure of probability with respect to
the plurality of qualities. Each of the plurality of qualities may be
represented by an axis whose two end points correspond to mutually
exclusive characteristics. Based on the comparison, the texts to be
analyzed are then classified in terms of the plurality of qualities. In
addition, a fuzzy logic retrieval system and a system for generating the
training data are provided.
Een automatisch systeem van de tekstclassificatie wordt verstrekt dat woorden en woordopeenvolgingen uit een te analyseren tekst of teksten haalt. De gehaalde woorden en de woordopeenvolgingen worden vergeleken met opleidingsgegevens bestaand uit woorden en woordopeenvolgingen samen met een maatregel van waarschijnlijkheid met betrekking tot de meerderheid van kwaliteiten. Elk van de meerderheid van kwaliteiten kan door een as worden vertegenwoordigd de waarvan twee eindpunten aan wederzijds exclusieve kenmerken beantwoorden. Gebaseerd op de vergelijking, zijn de te analyseren teksten dan geclassificeerd in termen van de meerderheid van kwaliteiten. Bovendien worden een systeem van de verwarde logicaherwinning en een systeem om de opleidingsgegevens te produceren verstrekt.