A method, apparatus, and article of manufacture for performing data mining
applications in a massively parallel relational database management
system. A scalable data mining function comprising an automated histogram
bin data derivation assist function is instantiated and parameterized via
an analytic application programming interface (API). The automated
histogram bin data derivation assist function comprises a query that is
performed directly within the relational database management system,
wherein the automated histogram bin data derivation assist function
derives a new data element in the relational database based on a relation
of a particular value of another data element to that element's overall
distribution in the relational database.
Een methode, apparaten, en een artikel van vervaardiging voor het uitvoeren van de toepassingen van de gegevensmijnbouw in een massaal parallel relationeel systeem van het gegevensbestandbeheer. Een scalable functie die van de gegevensmijnbouw uit een geautomatiseerde de gegevensafleiding bestaat van de histogrambak staat functie bij wordt geconcretiseerd en wordt de parameters bepaald van via een analitische toepassing programmeringsinterface (API). De geautomatiseerde de gegevensafleiding van de histogrambak staat functie bij bestaat uit een vraag die direct binnen het relationele systeem van het gegevensbestandbeheer wordt uitgevoerd, waarin woont bij de geautomatiseerde de gegevensafleiding van de histogrambak leidt de functie een nieuw gegevenselement in de relationele gegevensbank af die op een relatie van een bepaalde waarde van een ander gegevenselement aan de algemene distributie van dat element in de relationele gegevensbank wordt gebaseerd.