In a text mining technique, if the system only extracts characteristic
words and phrases frequently cooccurring with the respective components of
an analysis axis as an analysis condition, similar words and phrases are
extracted for any component. To clearly indicate existence of
characteristic words and phrases which do not appear as cooccurrence words
and phrases for other components of the analysis axis, it is desired to
appropriately present distinguishable features between the components to
the user. For this purpose, the frequency of appearances of a plurality of
characteristic words and phrases in a document satisfying each analysis
condition is calculated. As a result, multiple cooccurrence words and
phrases and component-cooccurrence words and phrases are discriminatively
displayed. It is therefore possible for the user to appropriately analyze
the contents of a plurality of documents.
В техника минирования текста, если система только извлекают характерные слова и фразы част cooccurring с соответственно компонентами оси анализа как условие анализа, то подобные слова и фразы извлечены для любого компонента. Ясно для того чтобы показать существование характерных слов и фраз не появляются как слова и фразы cooccurrence для других компонентов оси анализа, пожеланы, что соотвествующе представляет distinguishable характеристики между компонентами к потребителю. Для этой цели, высчитаны частота возникновений множественности характерных слов и фразы в документе удовлетворяя каждое условие анализа. В результате, множественные слова cooccurrence и фразы и слова и фразы komponenta-cooccurrence дискриминативно показаны. Поэтому по возможности для потребителя соотвествующе проанализировать содержание множественности документов.