The present mechanism relates to a method and apparatus for generating
responses to queries to a document retrieval system. The system responds
to a specific request for information by locating and ranking portions of
text that may contain the information sought. It locates small relevant
passages of text (called "hit passages") and ranks them according to an
estimate of the degree to which they correspond to the information sought.
The system minimizes the number of these hit passages that need to be
examined before an information seeker has either found the desired
information or can safely conclude that the information sought is not in
the collection of texts. A relaxation ranking mechanism is provided to
accommodate paraphrase variations that occur between the description of
the information sought and the content of the text passages that may
constitute suitable answers, by retrieving phrases that are dissimilar to
the query phrase to different degrees according to a predefined set of
rules, and penalizing the retrieved phrases based upon the degree of this
dissimilarity, thus providing the user with a priority organized query hit
list.
Het huidige mechanisme heeft op een methode en een apparaat om reacties op vragen aan een systeem van de documentherwinning te produceren betrekking. Het systeem geeft aan een specifiek verzoek om informatie gevolg door van gedeelten van tekst de plaats te bepalen en te rangschikken die de verkregen informatie kunnen bevatten. Het bepaalt de plaats van kleine relevante passages van tekst (genoemd "klappassages") en rangschikt hen volgens een raming van de graad waaraan zij aan de verkregen informatie beantwoorden. Het systeem minimaliseert het aantal deze klappassages die moeten worden onderzocht alvorens een informatiezoeker of de gewenste informatie heeft gevonden of kunnen veilig besluiten dat de verkregen informatie niet in de inzameling van teksten is. Een ontspanning die mechanisme rangschikt wordt verstrekt om parafrasevariaties aan te passen die tussen de beschrijving van de informatie voorkomen die en de inhoud van de tekstpassages die geschikte antwoorden kunnen vormen wordt verkregen, door uitdrukkingen terug te winnen die aan de vraaguitdrukking aan verschillende graden volgens een vooraf bepaalde reeks van regels ongelijk zijn, en het straffen van de teruggewonnen uitdrukkingen die op de graad van deze ongelijkheid worden gebaseerd, waarbij de gebruiker wordt voorzien van een prioriteit georganiseerde lijst van de vraagklap.