A set of words of a natural language is grouped by automatically obtaining
suffix relation data that indicate a relation value for each of a set of
relationships between suffixes that occur in the natural language, and,
then, by automatically clustering the words in the set using the relation
values from the suffix relation data, to obtain group data indicating
groups of words. Two or more words in a group have suffixes as in one of
the relationships and, preceding the suffixes, equivalent substrings. The
relationships can be pairwise relationships, and the relation value can
indicate the number of occurrences of a suffix pair. The suffix relation
data can be obtained using an inflectional lexicon. Complete link
clustering can be used.
Ein Satz Wörter einer natürlichen Sprache wird gruppiert, indem man automatisch Suffixrelation Daten erhält, die einen Relation Wert für jeden eines Satzes Verhältnisse zwischen Suffixen anzeigen, die in der natürlichen Sprache auftreten, und dann indem die Wörter im Satz automatisch sich sammeln, der die Relation verwendet, bewertet von den Suffixrelation Daten, um die Gruppe Daten zu erhalten, die Gruppen Wörter anzeigen. Zwei oder mehr Wörter in einer Gruppe haben Suffixe wie in einer der Verhältnisse und und gehen die Suffixe, die gleichwertigen Teilketten voran. Die Verhältnisse können Verhältnisse paarweise sein, und der Relation Wert kann die Zahl Auftreten eines Suffixpaares anzeigen. Die Suffixrelation Daten können mit einem inflectional Lexikon erhalten werden. Das komplette Verbindung Sammeln kann verwendet werden.