A data processing apparatus for extracting, from a set of data having a vector format stored in a database, a first prescribed number of items of data having a high degree of similarity with a query vector includes a list creation unit and a candidate output unit. The list creation unit creates lists of data in each of which data of the database is sorted in order of decreasing strength of respective one component of a vector. The candidate output unit decides the priority of each list, successively selects, from the lists based upon the list priority and ranking in each list, a second prescribed number of items of data not yet output, and outputs one item of data, from the second prescribed number of items of data selected, based upon degree of similarity between each item of the above-mentioned data and the query data. By virtue of the list creation unit and candidate output unit, the first prescribed number of items of candidate data similar to a query vector are obtained at high speed from the data in the database.

Un aparato de proceso de datos para extraer, de un sistema de datos que tenían un formato del vector almacenado en una base de datos, un primer prescribió el número de artículos de los datos que tenían un alto grado de semejanza con un vector de la pregunta incluye una unidad de la creación de la lista y una unidad de salida del candidato. La unidad de la creación de la lista crea listas de datos en cada uno de las cuales los datos de la base de datos se clasifiquen en orden de la fuerza que disminuye del un componente respectivo de un vector. La unidad de salida del candidato decide a la prioridad de cada lista, sucesivamente la selecciona, de las listas basadas sobre la prioridad y la graduación de la lista en cada lista, un segundo prescribió el número de artículos de los datos no todavía hechos salir, y las salidas un artículo de datos, del segundos prescribieron el número de los artículos de los datos seleccionados, basados sobre el grado de semejanza entre cada artículo de los datos antedichos y de los datos de la pregunta. En virtud de la unidad de salida de la unidad y del candidato de la creación de la lista, el primer prescribió el número de artículos del candidato que los datos similares a un vector de la pregunta se obtienen en la velocidad de los datos en la base de datos.

 
Web www.patentalert.com

< (none)

< Method for making soft tissue

> Method and apparatus for loading data into a cube forest data structure

> (none)

~ 00024