A document summarizing apparatus generates a comprehensive summary on a
group of documents of relatively diverse contents. The structure of
documents specified to be processed is analyzed in a phrase analyzing unit
to generate analytic trees describing the dependencies between words. An
analytic tree scoring unit adds scores to the analytic trees in accordance
with their importance. An analytic tree score accumulating unit
accumulates scored trees to unify the trees expressing the same concept to
increases the scores added to the unified analytic trees. A sentence
synthesizing unit then selects the trees with higher scores from within
the set of analytic trees stored in the analytic tree score accumulating
unit to synthesize a summary from the selected analytic trees. The present
invention allows less limitation to be applied to the documents to be
processed, as well as a comprehensive summary to be generated.
Ein zusammenfassenapparat des Dokumentes erzeugt eine komplette Zusammenfassung auf einer Gruppe Dokumenten des verhältnismäßig verschiedenen Inhalts. Die Struktur der Dokumente, die spezifiziert werden verarbeitet zu werden, wird in einer Phrase analysiert, die Maßeinheit analysiert, um die analytischen Bäume zu erzeugen, welche die Abhängigkeiten zwischen Wörtern beschreiben. Eine zählende Maßeinheit des analytischen Baums fügt Kerben den analytischen Bäumen in Übereinstimmung mit ihrem Wert hinzu. Eine analytische Baumkerbe, die Maßeinheit ansammelt, sammelt gezählte Bäume an, um die Bäume zu vereinheitlichen, die das gleiche Konzept zu den Zunahmen die Kerben ausdrücken, die den vereinheitlichten analytischen Bäumen hinzugefügt werden. Ein Satz, der Maßeinheit wählt synthetisiert dann, die Bäume mit höheren Kerben innerhalb vom Satz der analytischen Bäume vor, die in der analytischen Baumkerbe gespeichert werden, die Maßeinheit ansammelt, synthetisieren eine Zusammenfassung von den vorgewählten analytischen Bäumen. Die anwesende Erfindung erlaubt, daß weniger Beschränkung an den, angewendet wird sowie eine komplette erzeugt zu werden Zusammenfassung verarbeitet zu werden Dokumenten,.