Database system and methods are described for improving execution speed of
database queries (e.g., for decision support). A multi-attribute
selectivity optimization methodology is described that provides a more
accurate estimate of the cost of a query execution plan, so that the
predicted performance of the final execution plan will be more accurate.
The densities by how much the selectivity deviates from a single attribute
density and by how much the multi-attribute densities differ from one
another are used as a basis for multi-selectivity estimates. The
multi-attribute densities are used to scale estimates between extremes of
total independence and total dependence. By taking into account how well
attributes are correlated, the approach is able to provide more accurate
multi-selectivity estimates. As a result, the database system can
formulate better query plans and, thus, provide better performance.
Το σύστημα βάσεων δεδομένων και οι μέθοδοι περιγράφονται για τη βελτίωση της ταχύτητας εκτέλεσης των ερωτήσεων βάσεων δεδομένων (π.χ., για την υποστήριξη απόφασης). Μια multi-attribute μεθοδολογία βελτιστοποίησης επιλεκτικότητας περιγράφεται που παρέχει μια ακριβέστερη εκτίμηση του κόστους ενός σχεδίου εφαρμογής ερώτησης, έτσι ώστε η προβλεφθείσα εκτέλεση του τελικού σχεδίου εκτέλεσης θα είναι ακριβέστερη. Οι πυκνότητες από πόσο η επιλεκτικότητα παρεκκλίνει από μια ενιαία πυκνότητα ιδιοτήτων και από πόσο οι multi-attribute πυκνότητες διαφέρουν μεταξύ τους χρησιμοποιούνται ως βάση για τις εκτιμήσεις πολυ-επιλεκτικότητας. Οι multi-attribute πυκνότητες χρησιμοποιούνται στις εκτιμήσεις κλίμακας μεταξύ των άκρων της συνολικής ανεξαρτησίας και της συνολικής εξάρτησης. Με να λάβει υπόψη πόσο καλά οι ιδιότητες συσχετίζονται, η προσέγγιση είναι σε θέση να παρέχει τις ακριβέστερες εκτιμήσεις πολυ-επιλεκτικότητας. Κατά συνέπεια, το σύστημα βάσεων δεδομένων μπορεί να διατυπώσει τα καλύτερα σχέδια ερώτησης και, επομένως, να παρέχει την καλύτερη απόδοση.