A speech synthesizing apparatus acquires a synthesis unit speech segment
divided as a speech synthesis unit, and acquires partial speech segments
by dividing the synthesis unit speech segment with a phoneme boundary. The
power value required for each partial speech segment is estimated on the
basis of a target power value in reproduction. An amplitude magnification
is acquired from the ratio of the estimated power value to the reference
power value for each of the partial speech segments. Synthesized speech is
generated by changing the amplitude of each partial speech segment of the
synthesis unit speech segment on the basis of the acquired amplitude
magnification.
Een toespraak die apparaten samenstelt verwerft een de toespraaksegment van de syntheseeenheid dat als eenheid van de toespraaksynthese wordt verdeeld, en verwerft gedeeltelijke toespraaksegmenten door het de toespraaksegment van de syntheseeenheid met een foneemgrens te verdelen. De machtswaarde die voor elk gedeeltelijk toespraaksegment wordt vereist wordt geschat op basis van een waarde van de doelmacht in reproductie. Een omvangvergroting wordt verworven van de verhouding van de geschatte machtswaarde aan de waarde van de verwijzingsmacht voor elk van de gedeeltelijke toespraaksegmenten. De samengestelde toespraak wordt geproduceerd door de omvang van elk gedeeltelijk toespraaksegment van het de toespraaksegment van de syntheseeenheid op basis van de verworven omvangvergroting te veranderen.