A registration/search method for structured documents where correspondence
data is prepared between a fixed-length-string and a string occurrence
position within a structured document for all fixed-length-strings in the
document and for each structured document. A list of a character and all
hierarchical elements containing the character and element lengths is
prepared. An occurrence frequency and an occurrence position of a search
term is obtained using the plurality of fixed-length-substrings and the
occurrence frequency extracting index. A search character is selected from
the search term. A hierarchical element containing the search character is
obtained using the character from the element length index. A length of
the element corresponding to a search range is extracted using the
obtained occurrence position. A matching degree for the search term is
calculated from the obtained occurrence frequency of the search term and
the extracted element length of the element corresponding to the search
range.
Eine registration/search Methode für strukturierte Dokumente, in denen Korrespondenzdaten zwischen eine örtlich festgelegt-Länge-Zeichenkette und eine Zeichenketteauftretenposition innerhalb eines strukturierten Dokumentes für alle örtlich festgelegt-Länge-Zeichenketten im Dokument und für jedes strukturierte Dokument vorbereitet werden. Eine Liste eines Buchstabens und aller hierarchischen Elemente, welche die Buchstabe und Elementlängen enthalten, wird vorbereitet. Eine Auftretenfrequenz und eine Auftretenposition einer Suchbezeichnung wird mit der Mehrzahl von örtlich festgelegt-Länge-Teilketten und von Auftretenfrequenz, die Index extrahiert erreicht. Ein Suchbuchstabe wird von der Suchbezeichnung vorgewählt. Ein hierarchisches Element, das den Suchbuchstaben enthält, wird mit dem Buchstaben vom Elementlänge Index erhalten. Eine Länge des Elements, das einer Suchstrecke entspricht, wird mit der erreichten Auftretenposition extrahiert. Ein zusammenpassender Grad für die Suchbezeichnung wird von der erreichten Auftretenfrequenz der Suchbezeichnung und von der extrahierten Elementlänge des Elements errechnet, das der Suchstrecke entspricht.