Method and apparatus for controlling a speech synthesis system to provide multiple styles of speech page

A method and apparatus for synthesizing speech from text whereby the speech may be generated in a manner so as to effectively convey a particular, selectable style. Repeated patterns of one or more prosodic features--such as, for example, pitch, amplitude, spectral tilt, and/or duration--occurring at characteristic locations in the synthesized speech, are advantageously used to convey a particular chosen style. For example, one or more of such feature patterns may be used to define a particular speaking style, and an illustrative text-to-speech system then makes use of such a defined style to adjust the specified parameter or parameters of the synthesized speech in a non-uniform manner (i.e., in accordance with the defined feature pattern or patterns).

Een methode en een apparaat om toespraak van tekst samen te stellen waardoor de toespraak op een manier kan worden geproduceerd om een bepaalde, verkiesbare stijl effectief te vervoeren. De herhaalde patronen van één of meerdere prosodische eigenschappen -- zoals bijvoorbeeld, hoogte, omvang, spectrale schuine stand, en/of duur die -- bij kenmerkende plaatsen in de samengestelde toespraak worden voorkomt, voordelig gebruikt om een bepaalde gekozen stijl te vervoeren. Bijvoorbeeld, kunnen één of meer van dergelijke eigenschappatronen worden gebruikt om een bepaalde het spreken stijl te bepalen, en een illustratief text-to-speech systeem dan maakt gebruik van een dergelijke bepaalde stijl om de gespecificeerde parameter of de parameters van de samengestelde toespraak op een niet-uniforme manier (d.w.z., overeenkomstig het bepaalde eigenschappatroon of de patronen) aan te passen.