A database server supports weighted and unweighted sampling of records or
tuples in accordance with desired sampling semantics such as with
replacement (WR), without replacement (WoR), or independent coin flips
(CF) semantics, for example. The database server may perform such sampling
sequentially not only to sample non-materialized records, such as those
produced as a stream by a pipeline in a query tree for example, but also
to sample records, whether materialized or not, in a single pass. The
database server also supports sampling over a join of two relations of
records or tuples without requiring the computation of the full join and
without requiring the materialization of both relations and/or indexes on
the join attribute values of both relations.
Ένας κεντρικός υπολογιστής βάσεων δεδομένων υποστηρίζει τη σταθμισμένη και αζύγιστη δειγματοληψία των αρχείων ή tuples σύμφωνα με την επιθυμητή σημασιολογία δειγματοληψίας όπως με την αντικατάσταση (WR), χωρίς αντικατάσταση (WoR), ή το ανεξάρτητο νόμισμα κτυπά τη σημασιολογία (CF), παραδείγματος χάριν. Ο κεντρικός υπολογιστής βάσεων δεδομένων μπορεί να εκτελέσει τέτοια δειγματοληψία διαδοχικά όχι μόνο μη-υλοποιημένα στα δείγμα αρχεία, όπως εκείνοι που παράγονται ως ρεύμα από μια σωλήνωση σε ένα δέντρο ερώτησης παραδείγματος χάριν, αλλά και στα αρχεία δειγμάτων, είτε που υλοποιούνται είτε όχι, σε ένα ενιαίο πέρασμα. Ο κεντρικός υπολογιστής βάσεων δεδομένων υποστηρίζει επίσης τη δειγματοληψία πέρα από ενώνει δύο σχέσεων των αρχείων ή tuples χωρίς απαίτηση του υπολογισμού του συνόλου ενώνουν και χωρίς απαίτηση της υλοποίησης και των δύο σχέσεων ή/και δεικτών ενώστε τις τιμές ιδιοτήτων και των δύο σχέσεων.