Paper documents are automatically converted into a hypertext-based format
so that they can be accessed through electronic networks, including the
Internet, or via non-volatile transfer media such as disks or CD-ROMs. The
invention generalizes the concept of form-based recognition while
extending the concept of document retrieval to include document structure
knowledge, thereby providing the advantages found in both form-based
recognition (utilization of document structure knowledge) and image-based
information retrieval (robustness). In a preferred embodiment, a method
according to the invention enables direct translation of a paper document
into a hypertext-based format so that it may be directly accessed through
the Internet using current browsers such as Mosaic, Netscape and
Microsoft's Explorer.
Papierdokumente werden automatisch in ein Hypertext-gegründetes Format umgewandelt, damit sie durch elektronische Netze, einschließlich das Internet oder über permanente Übergangsmittel wie Scheiben oder CD-ROMs erreicht werden können. Die Erfindung generalisiert das Konzept der Form-gegründeten Anerkennung beim Verlängern des Konzeptes des Dokumentenretrievals, um Dokumentstrukturwissen einzuschließen, dadurch siebereitstellt siebereitstellt die Vorteile, die in Form-gegründeter Anerkennung gefunden werden (Anwendung des Dokumentstrukturwissens) und in Bild-gegründeter Information Retrieval (Robustheit). In einer bevorzugten Verkörperung ermöglicht eine Methode entsprechend der Erfindung direkter Übersetzung eines Papierdokumentes in ein Hypertext-gegründetes Format, damit sie durch das Internet mit gegenwärtigen Datenbanksuchroutinen wie Mosaik-, Netscape und Microsoft Forscher direkt erreicht werden kann.