A method of organizing electronic documents for storage and subsequent
retrieval, involves storing a summary structure describing the structure
of summary records associated with each document. Each structured summary
record has at least one descriptor field representative of a
characteristic of the document. Predefined field entries identify a
characteristic of the document. Predefined keyword criteria associated
with the field entries are stored. Each document is analyzed to build a
text index listing the occurrence of unique significant words in the
document. The text index is compared with the keyword criteria to
determine the appropriate field entry for the document. For example, one
descriptor field might related to topic, which could have the field
entries of "financial" or "sports". The preponderance of certain keyword
criteria, such as "money" or "shares" would identify the document with the
financial topic.
Une méthode d'organiser les documents électroniques pour le stockage et la récupération suivante, implique de stocker une structure récapitulative décrivant la structure des compte rendu succinct liés à chaque document. Chaque compte rendu succinct structuré a au moins un représentant de champ de descripteur d'une caractéristique du document. Les entrées prédéfinies de champ identifient une caractéristique du document. Les critères prédéfinis de mot-clé se sont associés aux entrées de champ sont stockés. Chaque document est analysé pour établir un index des textes énumérant l'occurrence des mots significatifs uniques dans le document. L'index des textes est comparé aux critères de mot-clé pour déterminer l'entrée appropriée de champ pour le document. Par exemple, un champ de descripteur pourrait connexe à la matière, qui pourrait avoir les entrées de champ d'"financier" ou des "sports". La prépondérance de certains critères de mot-clé, tels que l'"argent" ou des "parts" identifierait le document avec la matière financière.