Methods and apparatus for identifying associated key words in a data set.
Associated key words are identified by a parser which firstly operates to
extract key words from a data set. These key words are then analyzed by
the parser to identify which key words, if any, have an association as
determined by a predefined set of rules. These rules are grammatical and
include, for example, two key words both being nouns that occur one after
the other without intervening low value words. A similar rule applies to
nouns followed by verbs but does not extend to verbs followed by nouns.
These rules allow terms and phrases such as "information technology" and
"wide area network" to be identified as associated key words rather than
as individual and unrelated key words.
Μέθοδοι και συσκευές για τις σχετικές βασικές λέξεις σε ένα σύνολο στοιχείων. Οι σχετικές βασικές λέξεις προσδιορίζονται από έναν κατατμητή που αρχικά λειτουργεί για να εξαγάγει τις βασικές λέξεις από ένα σύνολο στοιχείων. Αυτές οι βασικές λέξεις αναλύονται έπειτα από τον κατατμητή για να προσδιορίσουν ποιες βασικές λέξεις έχουν, ενδεχομένως, μια ένωση όπως καθορίζεται από ένα προκαθορισμένο σύνολο κανόνων. Αυτοί οι κανόνες είναι γραμματικοί και περιλαμβάνουν, παραδείγματος χάριν, δύο βασικές λέξεις και οι δύο που είναι ουσιαστικά που εμφανίζονται ένα μετά από άλλη χωρίς επεμβαίνοντας χαμηλές λέξεις αξίας. Ένας παρόμοιος κανόνας ισχύει για τα ουσιαστικά που ακολουθούνται από τα ρήματα αλλά δεν επεκτείνεται στα ρήματα που ακολουθούνται από τα ουσιαστικά. Αυτοί οι κανόνες επιτρέπουν στους όρους και τις φράσεις όπως η "τεχνολογία πληροφοριών" και "το δίκτυο ευρείας περιοχήσ" για να προσδιοριστούν ως σχετικές βασικές λέξεις παρά ως μεμονωμένες και ανεξάρτητες βασικές λέξεις.