A computer method of removing simple and strict redundant association rules
generated from large collections of data. A compact set of rules is
presented to an end user which is devoid of many redundancies in the
discovery of data patterns. The method is directed primarily to on-line
applications such as the Internet and Intranet. Given a number of large
itemsets as input, simple redundancies are removed by generating all
maximal ancestors, the frontier set, for each large itemset. The set of
maximal ancestors share a hierarchical relationship with the large itemset
from which they were derived and further satisfy an inequality whereby the
ratio of respective support values is less than the reciprocal of some
user defined confidence value.
The resulting compact rule set is displayed to an end user at some
specified level of support and confidence. The method is also able to
generate the full set of rules from the compact set.
Eine Computermethode des Entfernens einfach und der strengen überflüssigen Verbindung Richtlinien erzeugt von den großen Datenerfassungen. Kompakte Regeln werden einem Endbenutzer dargestellt, der von vielen Redundanzen in der Entdeckung der Datenmuster leer ist. Die Methode wird hauptsächlich auf on-line-Anwendungen wie das Internet und das Intranet verwiesen. Eine Anzahl von großen itemsets als Eingang gegeben, werden einfache Redundanzen durch das Erzeugen aller maximalen Vorfahren, der Grenzsatz, für jedes große itemset entfernt. Der Satz der maximalen Vorfahren teilen ein hierarchisches Verhältnis mit dem großen itemset, von dem sie abgeleitet wurden und erfüllen weiter eine Verschiedenheit, hingegen das Verhältnis der jeweiligen Unterstützungswerte kleiner ist, als das wechselseitig von etwas verbraucherbestimmtem Vertrauen Wert. Der resultierende kompakte Richtlinie Satz wird zu einem Endbenutzer auf irgendeinem spezifiziertem Niveau der Unterstützung und des Vertrauens angezeigt. Die MethodeIST auch in der Lage, die vollen Regeln vom kompakten Satz zu erzeugen.