A system and method for generating itemset associations in a memory storage
system comprising many transactions, with each transaction including one
or more items capable of forming the itemset associations. The method
involves generating a lexicographic tree structure having nodes
representing itemset associations meeting a minimum support criteria. In a
recursive manner, for each lexicographic least itemset (node) P of the
lexicographic tree structure, candidate extensions of the node P are first
determined. Then, the support of each of the candidate extensions is
counted to determine frequent extension itemsets of that node P, while
those itemsets not meeting a predetermined support criteria are
eliminated. Child nodes corresponding to the frequent extensions and
meeting the predetermined support criteria are created. For each frequent
child of node P, all itemset associations for all descendants of node P
are generated first. Thus, the lexicographic tree structure is generated
in a depth first manner. By projecting transactions upon the lexicographic
tree structure in a depth-first manner, the CPU time for counting large
itemsets is substantially reduced.
Um sistema e um método para gerar associações do itemset em um sistema do armazenamento da memória que compreende muitas transações, com cada transação including um ou mais artigo capaz de dar forma às associações do itemset. O método envolve gerar uma estrutura de árvore lexicographic que tem nós representar as associações do itemset que encontram-se com critérios mínimos de uma sustentação. Em uma maneira recursive, para cada lexicographic menos itemset (nó) P da estrutura de árvore lexicographic, extensões do candidato do nó P é determinado primeiramente. Então, a sustentação de cada uma das extensões do candidato está contada para determinar itemsets freqüentes da extensão desse nó P, quando aqueles itemsets que não se encontram com critérios predeterminados de uma sustentação forem eliminados. Os nós da criança que correspondem às extensões freqüentes e que encontram-se com os critérios predeterminados da sustentação são criados. Para cada criança freqüente do nó P, todas as associações do itemset para todos os descendentes do nó P são geradas primeiramente. Assim, a estrutura de árvore lexicographic é gerada em uma primeira maneira da profundidade. Projetando transações em cima da estrutura de árvore lexicographic em uma profundidade-primeira maneira, o momento do processador central para contar itemsets grandes é reduzido substancialmente.