A list of data of a database arranged in an order of a value of each
component of a vector is formed for each component. For each component
sequentially selected from base indexes, a pointer indicating data in an
ascending order of a difference between data in the list and a test data
is updated. Whether an end condition is satisfied or not is judged from a
difference of component value between the data indicated by the pointer
and the test data. If the end condition is not satisfied, whether a
rejection condition is satisfied or not is judged from a distance in a
partial space between the data indicated by the pointer and the test data.
If the rejection condition is not satisfied, a distance in a whole space
between the data indicated by the pointer and the text data is calculated.
A predetermined number of data pieces are retrieved in an ascending order
of a calculated distance. In this manner, the predetermined number of data
pieces having a high similarity to the test vector can be retrieved at
high speed from data of a vector format in the database.
Ένας κατάλογος στοιχείων μιας βάσης δεδομένων που τακτοποιείται κατά σειρά μια αξία κάθε συστατικού ενός διανύσματος διαμορφώνεται για κάθε συστατικό. Για κάθε συστατικό που επιλέγεται διαδοχικά από τους δείκτες βάσεων, ένας δείκτης που δείχνει τα στοιχεία κατά σειρά ανόδου μια διαφορά μεταξύ των στοιχείων στον κατάλογο και ενός στοιχείου δοκιμής ενημερώνεται. Εάν ένας όρος τελών είναι ικανοποιημένος ή δεν κρίνεται από μια διαφορά της συστατικής αξίας μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων δοκιμής. Εάν ο όρος τελών δεν είναι ικανοποιημένος, εάν ένας όρος απόρριψης είναι ικανοποιημένος ή δεν κρίνεται από μια απόσταση σε ένα μερικό διάστημα μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων δοκιμής. Εάν ο όρος απόρριψης δεν είναι ικανοποιημένος, μια απόσταση ολόκληρο σε ένα διάστημα μεταξύ των στοιχείων που υποδεικνύονται από το δείκτη και των στοιχείων κειμένων υπολογίζεται. Ένας προκαθορισμένος αριθμός κομματιών στοιχείων ανακτάται κατά σειρά ανόδου μια υπολογισμένη απόσταση. Με αυτόν τον τρόπο, ο προκαθορισμένος αριθμός κομματιών στοιχείων που έχουν μια υψηλή ομοιότητα στο διάνυσμα δοκιμής μπορεί να ανακτηθεί με την υψηλή ταχύτητα από τα στοιχεία ενός διανυσματικού σχήματος στη βάση δεδομένων.