Evaluation of rollups with distinct aggregates by using sequence of sorts and partitioning by measures page

Methods are provided for efficiently evaluating database queries including a rollup operator and a distinct aggregate function. Using a sequence of sorts, duplicate record elimination performed on previous sorts at lower, or finer, levels of the rollup operator is taken advantage of by performing subsequent sorts on the preceding sort. Hence, when moving from one rollup level to the next higher level, there are fewer data records to sort with respect to the relevant grouping columns for that level, and thus also fewer duplicate data records to eliminate for purposes of computing the distinct aggregate. Using parallel evaluation, processing of aggregate functions is split among different processing slaves, and the measure of an aggregate function is included as a partitioning key when sending data from one data flow operation to the next data flow operation of a query execution plan. Using parallel evaluation for a query that includes two or more aggregate functions, a measure code corresponding with each aggregate function and associated measure values are included as partitioning keys for enhanced load balancing and parallelization.

Methoden werden für leistungsfähig auswertende Datenbankfragen einschließlich einen Rollupoperator und eine eindeutige gesamte Funktion zur Verfügung gestellt. Mit einer Reihenfolge von Art, führte Duplikatrekordbeseitigung an der vorhergehenden Art an niedrigerem durch, oder feiner, wird Niveaus des Rollupoperators Nutzen gezogen aus, indem man folgende Art auf der vorhergehenden Art durchführt. Folglich beim Bewegen von einem Rollupniveau auf das folgende höhere Niveau, gibt es wenige in Bezug auf die relevanten gruppierenspalten für dieses Niveau zu sortieren, zwecks des Berechnens folglich auch zu beseitigen Datensätze, und wenige doppelte Datensätze der eindeutigen Gesamtheit. Mit paralleler Auswertung wird die Verarbeitung der gesamten Funktionen unter unterschiedlichen verarbeitensklaven aufgespaltet, und das Maß einer gesamten Funktion ist eingeschlossen, während ein verteilender Schlüssel, wenn er Daten von einem sendet, Betrieb zu folgenden Datenfluß Betrieb eines Frage Durchführung Planes Datenfluß. Das Verwenden der parallelen Auswertung für eine Frage, die zwei oder mehr Gesamtheitsfunktionen, ein Mascode, der mit jeder gesamten Funktion entsprechen und verbundene Maßwerte sind eingeschlossen als verteilende Schlüssel für das erhöhtes Last Ausgleichen und parallelization einschließt.