An automatic mining system that identifies a set of relevant terms from a large text database of unstructured information, such as the World Wide Web with a high degree of confidence. The automatic mining system includes a software program that enables the discovery of new relationships by association mining and refinement of co-occurrences, using automatic and iterative recognition of new binary relations through phrases that embody related pairs, by applying lexicographic and statistical techniques to classify the relations, and further by applying a minimal amount of domain knowledge of the relevance of the terms and relations. The automatic mining system includes a knowledge module and a statistics module. The knowledge module is comprised of a stemming unit, a synonym check unit, and a domain knowledge check unit. The stemming unit determines if the relation being analyzed shares a common root with a previously mined relation. The synonym check unit identifies the synonyms of the relation, and the domain knowledge check unit considers extrinsic factors for indications that would further clarify the relationship being mined. The statistics module optimizes the confidence level in the relationship.

Автоматическая минируя система определяет комплект уместных термин от большой базы данных текста unstructured информации, such as world wide web с большой уверенность. Автоматическая минируя система вклюает программу средства программирования включает открытие новых отношений минированием ассоциации и уточнение чо-vozniknoveni1, использующ автоматическое и итеративное опознавание новых бинарных отношений до фразы которые овеществляют родственные пары, путем методы применяться lexicographic и статистически для того чтобы расклассифицировать отношения, и продвигает путем прикладывать минимальное количество знания домена релевантности термин и отношений. Автоматическая минируя система вклюает модуль знания и модуль статистик. Модуль знания состоится из запруживая блока, блока проверки синонима, и блока проверки знания домена. Запруживая блоком обусловливает если отношение проанализированные доли общий корень с ранее минированным отношением. Блок проверки синонима определяет синонимы отношения, и блок проверки знания домена рассматривает extrinsic факторы для индикаций которые более добавочно уточюнили бы будучи минированными отношение. Модуль статистик оптимизирует уровень доверия в отношении.

 
Web www.patentalert.com

< Localization support method for software applications with backend database

< System and method for organizing data

> Time-axis compression/expansion method and apparatus for multichannel signals

> Player having cassette playing unit and memory card playing unit

~ 00065