A process and system for database storage and retrieval are described along
with methods for obtaining semantic profiles from a training text corpus,
i.e., text of known relevance, a method for using the training to guide
context-relevant document retrieval, and a method for limiting the range
of documents that need to be searched after a query. A neural network is
used to extract semantic profiles from text corpus. A new set of
documents, such as world wide web pages obtained from the Internet, is
then submitted for processing to the same neural network, which computes a
semantic profile representation for these pages using the semantic
relations learned from profiling the training documents. These semantic
profiles are then organized into clusters in order to minimize the time
required to answer a query. When a user queries the database, i.e., the
set of documents, his or her query is similarly transformed into a
semantic profile and compared with the semantic profiles of each cluster
of documents. The query profile is then compared with each of the
documents in that cluster. Documents with the closest weighted match to
the query are returned as search results.
Een proces en een systeem voor gegevensbestandopslag en herwinning worden beschreven samen met methodes om semantische profielen uit een opleidingscorpus, d.w.z., tekst van bekende relevantie, een methode om de opleiding te gebruiken om context-relevante documentherwinning te leiden, en een methode te verkrijgen om de waaier van documenten te beperken die na een vraag moeten worden gezocht. Een neuraal netwerk wordt gebruikt om semantische profielen uit corpus te halen. Een nieuwe reeks documenten, zoals World Wide Web pagina's die bij Internet worden verkregen, wordt dan voorgelegd voor verwerking aan het zelfde neurale netwerk, dat gegevens een semantische profielvertegenwoordiging voor deze pagina's gebruikend de semantische relaties verwerkt die van het profileren van de opleidingsdocumenten worden geleerd. Deze semantische profielen worden dan georganiseerd in clusters om de tijd te minimaliseren die wordt vereist om een vraag te beantwoorden. Wanneer een gebruiker het gegevensbestand vraagt, d.w.z., wordt de reeks documenten, zijn of haar vraag zo ook omgezet in een semantisch profiel en met de semantische profielen van elke cluster van documenten vergeleken. Het vraagprofiel wordt dan vergeleken met elk van de documenten in die cluster. De documenten met de dichtst gewogen gelijke aan de vraag zijn teruggekeerd als onderzoeksresultaten.