The cross-lingual retrieval system of the present invention retrieves
second language sentences which are appropriate translations of a query
written in a first language using pair data without being greatly
influenced by the difference in expression between the query and sentences
to be the object of retrieval, length of the query or sentences to be the
object of retrieval or the like. In the system, a pair data storing unit
stores multiple pairs each having a first language sentence and a second
language sentence having the same meaning. As a query receiving unit
receives a query written in the first language, a first retrieving unit
retrieves first language sentences similar to the query from a set of
first language sentences stored in the pair data storing unit. A second
retrieving unit then retrieves second language sentences similar to second
language sentences paired with the respective first language sentences
retrieved by the first retrieving unit from a set of second language
sentences stored in the pair data storing unit. That is, a first retrieval
of first language sentences from the pair data is performed based on a
query, and then a second retrieval of second language sentences from the
pair data is performed based on the result of the first retrieval.
El sistema de recuperación cross-lingual de la actual invención recupera las segundas oraciones de la lengua que son traducciones apropiadas de una pregunta escrita en una primera lengua usando datos del par sin grandemente ser influenciado por la diferencia en la expresión entre la pregunta y las oraciones a ser el objeto de la recuperación, de la longitud de la pregunta o de las oraciones a ser el objeto de la recuperación o de los similares. En el sistema, los datos del par que almacenan múltiplo de almacenes de la unidad aparean cada uno que tiene una primera oración de la lengua y una segunda oración de la lengua que tienen el mismo significado. Pues una pregunta que recibe la unidad recibe una pregunta escrita en la primera lengua, una primera unidad de recuperación recupera las primeras oraciones de la lengua similares a la pregunta de un sistema de las primeras oraciones de la lengua almacenadas en los datos del par que almacenan la unidad. Una segunda unidad de recuperación entonces recupera las segundas oraciones de la lengua similares a las segundas oraciones de la lengua apareadas con las primeras oraciones respectivas de la lengua recuperadas por la primera unidad de recuperación de un sistema de las segundas oraciones de la lengua almacenadas en los datos del par que almacenan la unidad. Es decir, una primera recuperación de las primeras oraciones de la lengua de los datos del par se realiza basó en una pregunta, y entonces una segunda recuperación de las segundas oraciones de la lengua de los datos del par se realiza basó en el resultado de la primera recuperación.