Methods and related systems for indexing the contents of documents for
comparison with the contents of other documents to identify matching
content. A method for comparing the contents of a query document to the
content on the World Wide Web is set forth. The contents of a query
document are indexed and compared to content from the World Wide Web which
is continuously retrieved and indexed. The method for indexing may
comprise selecting substrings from the document, hashing the substrings to
generate a plurality of hash values having a known range of values,
selecting certain hash values to save from the generated hash values, and
sorting the saved hash values. Methods for selecting certain hash values
to save are set forth.
Μέθοδοι και σχετικά συστήματα για το περιεχόμενο των εγγράφων για τη σύγκριση με το περιεχόμενο άλλων εγγράφων για να προσδιορίσει το ταιριάζοντας με περιεχόμενο. Μια μέθοδος για το περιεχόμενο ενός εγγράφου ερώτησης με το περιεχόμενο στο World Wide Web εκτίθεται. Το περιεχόμενο ενός εγγράφου ερώτησης συντάσσεται και συγκρίνεται με το περιεχόμενο από το World Wide Web που ανακτάται συνεχώς και συντάσσεται. Η μέθοδος για μπορεί να περιλάβει την επιλογή των substrings από το έγγραφο, που κομματιάζει τα substrings για να παραγάγει μια πολλαπλότητα hash των τιμών που έχουν μια γνωστή σειρά των τιμών, που επιλέγουν ορισμένες hash τιμές για να σώσει από τις παραγμένες hash τιμές, και που ταξινομούν τις σωζόμενες hash τιμές. Οι μέθοδοι για ορισμένες hash τιμές που σώζουν εκτίθενται.