A database server supports weighted and unweighted sampling of records or
tuples in accordance with desired sampling semantics such as with
replacement (WR), without replacement (WoR), or independent coin flips
(CF) semantics, for example. The database server may perform such sampling
sequentially not only to sample non-materialized records such as those
produced as a stream by a pipeline in a query tree for example, but also
to sample records, whether materialized or not, in a single pass. The
database server also supports sampling over a join of two relations of
records or tuples without requiring the computation of the full join and
without requiring the materialization of both relations and/or indexes on
the join attribute values of both relations.
Un serveur de base de données soutient pesé et unweighted le prélèvement des disques ou les tuples selon la sémantique d'échantillonnage désirée comme avec le remplacement (WR), sans remplacement (WoR), ou la pièce de monnaie indépendante renverse la sémantique (de CF), par exemple. Le serveur de base de données puisse effectuer un tel prélèvement séquentiellement non seulement aux disques non-matérialisés par échantillon comme ceux produits comme jet par une canalisation dans un arbre de question par exemple, mais également prélever des disques, que matérialisé ou pas, dans un passage simple. Le serveur de base de données soutient également l'excédent de prélèvement un joindre de deux relations des disques ou les tuples sans exiger le calcul du plein se joignent et sans exiger le materialization des deux relations et/ou index sur le joindre attribuez les valeurs des deux relations.