A system and method are provided for discovering significant patterns from
a list of records in a dataset. Each record includes a set of items, and
each significant pattern includes a subset of items such that a
significance of the pattern exceeds a significance level. A significance
is computed for each item in the list of records to determine significant
items. The records are randomly sampled to select a sample portion of the
records. Ambiguous patterns are identified against the sample portion of
the records and verified against the entire list of records in the
dataset.
Een systeem en een methode worden verstrekt voor het ontdekken van significante patronen van een lijst van verslagen in een dataset. Elk verslag omvat een reeks punten, en elk significant patroon omvat een ondergroep van punten dusdanig dat een betekenis van het patroon een betekenisniveau overschrijdt. Een betekenis wordt gegevens verwerkt voor elk punt in de lijst van verslagen om significante punten te bepalen. De verslagen worden willekeurig bemonsterd om een steekproefgedeelte verslagen te selecteren. De dubbelzinnige patronen worden geïdentificeerd tegen het steekproefgedeelte verslagen en tegen de volledige lijst van verslagen in de dataset geverifieerd.