The Chinese generation apparatus for machine translation utilizes statistic
data for Chinese generation instead of a large number of semantic,
grammatical related rules, the statistic data being retrieved from a
tagged Chinese corpus. In order to overcome the problem that a large
number of semantic or grammatical rules are needed in Chinese generation,
the constitution of a Chinese sentence is divided into basic sentence
pattern item and other items. The probability of the possibly generated
basic sentence pattern of each Chinese verb and the location probability
of the other item in the basic sentence pattern are initially retrieved
from the Chinese corpus and are stored in the buffer unit. The best basic
sentence pattern and the location of the other items can be found in
accordance with each constitution item of the intermediate form of Chinese
and the statistic information in the buffer unit with the use of
branch-and-bound method, so that the most suitable Chinese sentence can be
generated.
Der chinesische Erzeugung Apparat für maschinelle Übersetzung verwendet Statistikdaten für chinesisches Erzeugung anstelle von vielen semantischen, grammatischen in Verbindung stehenden Richtlinien, die Statistikdaten, die von einem etikettierten chinesischen Korpus zurückgeholt werden. Um das Problem zu überwinden das viele semantische oder grammatische Richtlinien im chinesischen Erzeugung benötigt werden, wird die Beschaffenheit eines chinesischen Satzes in grundlegendes Satzmustereinzelteil und in andere Einzelteile geteilt. Die Wahrscheinlichkeit des vielleicht erzeugten grundlegenden Satzmusters jedes chinesischen Verbs und die Position Wahrscheinlichkeit des anderen Einzelteils im grundlegenden Satzmuster werden zuerst vom chinesischen Korpus zurückgeholt und werden in der Puffermaßeinheit gespeichert. Das beste grundlegende Satzmuster und die Position der anderen Einzelteile können in Übereinstimmung mit jedem Beschaffenheiteinzelteil der Zwischenform des Chinesen und der Statistikinformationen in der Puffermaßeinheit mit dem Gebrauch von Verzweigungsmethode gefunden werden, damit der verwendbarste chinesische Satz erzeugt werden kann.