An automatic mining system that identifies a set of relevant terms from a
large text database of unstructured information, such as the World Wide
Web with a high degree of confidence. The automatic mining system includes
a software program that enables the discovery of new relationships by
association mining and refinement of co-occurrences, using automatic and
iterative recognition of new binary relations through phrases that embody
related pairs, by applying lexicographic and statistical techniques to
classify the relations, and further by applying a minimal amount of domain
knowledge of the relevance of the terms and relations. The automatic
mining system includes a knowledge module and a statistics module. The
knowledge module is comprised of a stemming unit, a synonym check unit,
and a domain knowledge check unit. The stemming unit determines if the
relation being analyzed shares a common root with a previously mined
relation. The synonym check unit identifies the synonyms of the relation,
and the domain knowledge check unit considers extrinsic factors for
indications that would further clarify the relationship being mined. The
statistics module optimizes the confidence level in the relationship.
Автоматическая минируя система определяет комплект уместных термин от большой базы данных текста unstructured информации, such as world wide web с большой уверенность. Автоматическая минируя система вклюает программу средства программирования включает открытие новых отношений минированием ассоциации и уточнение чо-vozniknoveni1, использующ автоматическое и итеративное опознавание новых бинарных отношений до фразы которые овеществляют родственные пары, путем методы применяться lexicographic и статистически для того чтобы расклассифицировать отношения, и продвигает путем прикладывать минимальное количество знания домена релевантности термин и отношений. Автоматическая минируя система вклюает модуль знания и модуль статистик. Модуль знания состоится из запруживая блока, блока проверки синонима, и блока проверки знания домена. Запруживая блоком обусловливает если отношение проанализированные доли общий корень с ранее минированным отношением. Блок проверки синонима определяет синонимы отношения, и блок проверки знания домена рассматривает extrinsic факторы для индикаций которые более добавочно уточюнили бы будучи минированными отношение. Модуль статистик оптимизирует уровень доверия в отношении.