Process and system for retrieval of documents using context-relevant semantic profiles

A process and system for database storage and retrieval are described along with methods for obtaining semantic profiles from a training text corpus, i.e., text of known relevance, a method for using the training to guide context-relevant document retrieval, and a method for limiting the range of documents that need to be searched after a query. A neural network is used to extract semantic profiles from text corpus. A new set of documents, such as world wide web pages obtained from the Internet, is then submitted for processing to the same neural network, which computes a semantic profile representation for these pages using the semantic relations learned from profiling the training documents. These semantic profiles are then organized into clusters in order to minimize the time required to answer a query. When a user queries the database, i.e., the set of documents, his or her query is similarly transformed into a semantic profile and compared with the semantic profiles of each cluster of documents. The query profile is then compared with each of the documents in that cluster. Documents with the closest weighted match to the query are returned as search results.
Een proces en een systeem voor gegevensbestandopslag en herwinning worden beschreven samen met methodes om semantische profielen uit een opleidingscorpus, d.w.z., tekst van bekende relevantie, een methode om de opleiding te gebruiken om context-relevante documentherwinning te leiden, en een methode te verkrijgen om de waaier van documenten te beperken die na een vraag moeten worden gezocht. Een neuraal netwerk wordt gebruikt om semantische profielen uit corpus te halen. Een nieuwe reeks documenten, zoals World Wide Web pagina's die bij Internet worden verkregen, wordt dan voorgelegd voor verwerking aan het zelfde neurale netwerk, dat gegevens een semantische profielvertegenwoordiging voor deze pagina's gebruikend de semantische relaties verwerkt die van het profileren van de opleidingsdocumenten worden geleerd. Deze semantische profielen worden dan georganiseerd in clusters om de tijd te minimaliseren die wordt vereist om een vraag te beantwoorden. Wanneer een gebruiker het gegevensbestand vraagt, d.w.z., wordt de reeks documenten, zijn of haar vraag zo ook omgezet in een semantisch profiel en met de semantische profielen van elke cluster van documenten vergeleken. Het vraagprofiel wordt dan vergeleken met elk van de documenten in die cluster. De documenten met de dichtst gewogen gelijke aan de vraag zijn teruggekeerd als onderzoeksresultaten.

Web www.patentalert.com

< (none)

< System and method for integrating paper-based business documents with computer-readable data entered via a computer network

> Internet billing method

> (none)

~ 00004