Grouping words with equivalent substrings by automatic clustering based on suffix relationships

A set of words of a natural language is grouped by automatically obtaining suffix relation data that indicate a relation value for each of a set of relationships between suffixes that occur in the natural language, and, then, by automatically clustering the words in the set using the relation values from the suffix relation data, to obtain group data indicating groups of words. Two or more words in a group have suffixes as in one of the relationships and, preceding the suffixes, equivalent substrings. The relationships can be pairwise relationships, and the relation value can indicate the number of occurrences of a suffix pair. The suffix relation data can be obtained using an inflectional lexicon. Complete link clustering can be used.
Ein Satz Wörter einer natürlichen Sprache wird gruppiert, indem man automatisch Suffixrelation Daten erhält, die einen Relation Wert für jeden eines Satzes Verhältnisse zwischen Suffixen anzeigen, die in der natürlichen Sprache auftreten, und dann indem die Wörter im Satz automatisch sich sammeln, der die Relation verwendet, bewertet von den Suffixrelation Daten, um die Gruppe Daten zu erhalten, die Gruppen Wörter anzeigen. Zwei oder mehr Wörter in einer Gruppe haben Suffixe wie in einer der Verhältnisse und und gehen die Suffixe, die gleichwertigen Teilketten voran. Die Verhältnisse können Verhältnisse paarweise sein, und der Relation Wert kann die Zahl Auftreten eines Suffixpaares anzeigen. Die Suffixrelation Daten können mit einem inflectional Lexikon erhalten werden. Das komplette Verbindung Sammeln kann verwendet werden.

Web www.patentalert.com

< (none)

< Method of storing elements in a database

> Parallel spectral reed-solomon encoder and decoder

> (none)

~ 00018