A method and system are disclosed for performing spatial similarity joins on high-dimensional points that represent data objects of a database. The method comprises the steps of: generating a data structure based on the similarity distance .epsilon. for organizing the high-dimensional points, traversing the data structure to select pairs of leaf nodes from which the high-dimensional points are joined, and joining the points from selected pairs of nodes according to a joining condition based on the similarity distance .epsilon.. An efficient data structure referred to as an .epsilon.-K-D-B tree is disclosed to provide fast access to the high-dimensional points and to minimize system storage requirements. The invention provides algorithms for generating the .epsilon.-K-D-B tree using biased splitting to minimize the number of nodes to be examined during join operations. The traversing step includes joining selected pairs of nodes and also self-joining selected nodes. Alternatively, the data structure is an R+tree generated using biased splitting.

Μια μέθοδος και ένα σύστημα αποκαλύπτονται για την εκτέλεση της χωρικής ομοιότητας ενώνουν στα υψηλός-διαστατικά σημεία που αντιπροσωπεύουν τα αντικείμενα στοιχείων μιας βάσης δεδομένων. Η μέθοδος περιλαμβάνει τα βήματα: παράγοντας μια δομή δεδομένων βασισμένη στην απόσταση ομοιότητας επσηλον. για την οργάνωση των υψηλός-διαστατικών σημείων, που διαπερνούν τη δομή δεδομένων για να επιλέξει τα ζευγάρια των κόμβων φύλλων από τα οποία τα υψηλός-διαστατικά σημεία ενώνονται, και ενώνοντας τα σημεία από τα επιλεγμένα ζευγάρια των κόμβων σύμφωνα με έναν όρο ένωσης βασισμένο στην απόσταση ομοιότητας επσηλον .. Μια αποδοτική δομή δεδομένων καλούμενη το δέντρο επσηλον.-Κ-δ-β αποκαλύπτεται για να παρέχει τη γρήγορη πρόσβαση στα υψηλός-διαστατικά σημεία και για να ελαχιστοποιήσει τις απαιτήσεις αποθήκευσης συστημάτων. Η εφεύρεση παρέχει ότι οι αλγόριθμοι για το δέντρο επσηλον.-Κ-δ-β που χρησιμοποιεί τον προκατειλημμένο διαχωρισμό για να ελαχιστοποιήσουν τον αριθμό κόμβων που εξετάζονται κατά τη διάρκεια ενώνουν τις διαδικασίες. Το διαπερνώντας βήμα περιλαμβάνει τα ένωση επιλεγμένα ζευγάρια των κόμβων και μόνος-ενώνοντας των επίσης επιλεγμένων κόμβων. Εναλλακτικά, η δομή δεδομένων είναι ένα R+tree που παράγεται χρησιμοποιώντας τον προκατειλημμένο διαχωρισμό.

 
Web www.patentalert.com

< (none)

< Accessing multi-dimensional data by mapping dense data blocks to rows in a relational database

> Processing records from a database

> (none)

~ 00002