Data display method and apparatus for use in text mining

   
   

In a text mining technique, if the system only extracts characteristic words and phrases frequently cooccurring with the respective components of an analysis axis as an analysis condition, similar words and phrases are extracted for any component. To clearly indicate existence of characteristic words and phrases which do not appear as cooccurrence words and phrases for other components of the analysis axis, it is desired to appropriately present distinguishable features between the components to the user. For this purpose, the frequency of appearances of a plurality of characteristic words and phrases in a document satisfying each analysis condition is calculated. As a result, multiple cooccurrence words and phrases and component-cooccurrence words and phrases are discriminatively displayed. It is therefore possible for the user to appropriately analyze the contents of a plurality of documents.

В техника минирования текста, если система только извлекают характерные слова и фразы част cooccurring с соответственно компонентами оси анализа как условие анализа, то подобные слова и фразы извлечены для любого компонента. Ясно для того чтобы показать существование характерных слов и фраз не появляются как слова и фразы cooccurrence для других компонентов оси анализа, пожеланы, что соотвествующе представляет distinguishable характеристики между компонентами к потребителю. Для этой цели, высчитаны частота возникновений множественности характерных слов и фразы в документе удовлетворяя каждое условие анализа. В результате, множественные слова cooccurrence и фразы и слова и фразы komponenta-cooccurrence дискриминативно показаны. Поэтому по возможности для потребителя соотвествующе проанализировать содержание множественности документов.

 
Web www.patentalert.com

< Crystals, molecular complexes, and methods of developing lead compounds for inhibitors of bacterial IMPDH

< Digital logic optimization using selection operators

> Method, system and program product for utilizing a configuration database to configure a hardware digital system

> Method and apparatus for sending and tracking resume data sent via URL

~ 00113