Methods are provided for efficiently evaluating database queries including
a rollup operator and a distinct aggregate function. Using a sequence of
sorts, duplicate record elimination performed on previous sorts at lower,
or finer, levels of the rollup operator is taken advantage of by
performing subsequent sorts on the preceding sort. Hence, when moving from
one rollup level to the next higher level, there are fewer data records to
sort with respect to the relevant grouping columns for that level, and
thus also fewer duplicate data records to eliminate for purposes of
computing the distinct aggregate. Using parallel evaluation, processing of
aggregate functions is split among different processing slaves, and the
measure of an aggregate function is included as a partitioning key when
sending data from one data flow operation to the next data flow operation
of a query execution plan. Using parallel evaluation for a query that
includes two or more aggregate functions, a measure code corresponding
with each aggregate function and associated measure values are included as
partitioning keys for enhanced load balancing and parallelization.
Methoden werden für leistungsfähig auswertende Datenbankfragen einschließlich einen Rollupoperator und eine eindeutige gesamte Funktion zur Verfügung gestellt. Mit einer Reihenfolge von Art, führte Duplikatrekordbeseitigung an der vorhergehenden Art an niedrigerem durch, oder feiner, wird Niveaus des Rollupoperators Nutzen gezogen aus, indem man folgende Art auf der vorhergehenden Art durchführt. Folglich beim Bewegen von einem Rollupniveau auf das folgende höhere Niveau, gibt es wenige in Bezug auf die relevanten gruppierenspalten für dieses Niveau zu sortieren, zwecks des Berechnens folglich auch zu beseitigen Datensätze, und wenige doppelte Datensätze der eindeutigen Gesamtheit. Mit paralleler Auswertung wird die Verarbeitung der gesamten Funktionen unter unterschiedlichen verarbeitensklaven aufgespaltet, und das Maß einer gesamten Funktion ist eingeschlossen, während ein verteilender Schlüssel, wenn er Daten von einem sendet, Betrieb zu folgenden Datenfluß Betrieb eines Frage Durchführung Planes Datenfluß. Das Verwenden der parallelen Auswertung für eine Frage, die zwei oder mehr Gesamtheitsfunktionen, ein Mascode, der mit jeder gesamten Funktion entsprechen und verbundene Maßwerte sind eingeschlossen als verteilende Schlüssel für das erhöhtes Last Ausgleichen und parallelization einschließt.