A computer system and method for performing similarity searches which is
phase and scale insensitive and which allows similarity searches to be
performed at a semantic level. Each sequence in a database is preferably
segmented at multiple projections and/or resolution levels. The sequences
may represent object having multi-dimensional features such as temporal
and/or spatial-temporal data. Preferably, the segmenting logic starts with
the finest resolution, and each sequence is parsed into a number of
disjointed segments, wherein each segment has uniform features. The
uniform features could be segments having a constant slope, or waveform
segments representable by a single function. The segments may then be
re-sampled into a fixed length vector with appropriate normalization. A
label may also be assigned to each segment via conventional
clustering/classification methods. The above steps are iterated at
successive projections and/or resolution levels until each sequence in the
database has been independently segmented and clustered. Thus, the labels
are preferably extracted in a pseudo-hierarchical manner in which the
label of the lowest resolution representation of the sequence is extracted
first. The representation of each time series at various resolutions
and/or projections captures different characteristics of the same time
series (or 2D/3D objects). Recall that each segment represents a region
having uniform features. The segmentation at each individual resolution
and/or projection thus enables recognition or emphasis of different
characteristics within segments having uniform features.
Ένα συγκρότημα ηλεκτρονικών υπολογιστών και μια μέθοδος για τις αναζητήσεις ομοιότητας που είναι φάση και κλίμακα αναίσθητες και που επιτρέπει στις αναζητήσεις ομοιότητας για να εκτελεσθεί σε σημασιολογικό επίπεδο. Κάθε ακολουθία σε μια βάση δεδομένων είναι κατά προτίμηση τεμμένη στις πολλαπλάσια προβολές ή/και επίπεδα ψηφίσματος. Οι ακολουθίες μπορούν να αντιπροσωπεύσουν το αντικείμενο που έχει τα πολυδιάστατα χαρακτηριστικά γνωρίσματα όπως τα χρονικά ή/και χωρικός-χρονικά στοιχεία. Κατά προτίμηση, η λογική τομής αρχίζει με το λεπτότερο ψήφισμα, και κάθε ακολουθία αναλύεται σε διάφορα χωρισμένα τμήματα, όπου κάθε τμήμα έχει τα ομοιόμορφα χαρακτηριστικά γνωρίσματα. Τα ομοιόμορφα χαρακτηριστικά γνωρίσματα θα μπορούσαν να είναι τμήματα που έχουν μια σταθερή κλίση, ή τμήματα κυματοειδούς αντιπροσωπεύσιμα από μια ενιαία λειτουργία. Τα τμήματα μπορούν έπειτα να ληφθούν ως δείγμα εκ νέου σε ένα σταθερό διάνυσμα μήκους με την κατάλληλη κανονικοποίηση. Μια ετικέτα μπορεί επίσης να οριστεί σε κάθε τμήμα μέσω των συμβατικών μεθόδων συγκέντρωσης/ταξινόμησης. Τα ανωτέρω βήματα επαναλαμβάνονται στις διαδοχικά προβολές ή/και επίπεδα ψηφίσματος έως ότου έχει τεμθεί ανεξάρτητα κάθε ακολουθία στη βάση δεδομένων και έχει συγκεντρωθεί. Κατά συνέπεια, οι ετικέτες εξάγονται κατά προτίμηση κατά τρόπο ψευδο-ιεραρχικό κατά τον οποίο η ετικέτα της χαμηλότερης αντιπροσώπευσης ψηφίσματος της ακολουθίας εξάγεται πρώτα. Η αντιπροσώπευση κάθε φορά που συλλαμβάνει η σειρά στα διάφορες ψηφίσματα ή/και τις προβολές τα διαφορετικά χαρακτηριστικά των ίδιων χρονικών σειρών (ή των αντικειμένων 2D/3D). Ανάκληση ότι κάθε τμήμα αντιπροσωπεύει μια περιοχή που έχει τα ομοιόμορφα χαρακτηριστικά γνωρίσματα. Η κατάτμηση σε κάθε μεμονωμένες ψήφισμα ή/και προβολή επιτρέπει έτσι την αναγνώριση ή την έμφαση των διαφορετικών χαρακτηριστικών μέσα στα τμήματα που έχουν τα ομοιόμορφα χαρακτηριστικά γνωρίσματα.