2023

Going retro: Erstaunlich einfache und dennoch effektive regelbasierte Prosodiemodellierung für die Sprachsynthese zur Simulation von Emotionsdimensionen

Felix Burkhardt, Uwe Reichel, Florian Eyben und Björn Schuller

Wir stellen zwei regelbasierte Modelle vor, um die Prosodie der Sprachsynthese zu modulieren, um die auszudrückende Emotion zu modulieren. Die Prosodie-Modulation basiert auf der Speech Synthesis Markup Language (SSML) und kann mit jedem kommerziellen Sprachsynthesizer verwendet werden. Die Modelle sowie die Optimierungsergebnisse werden anhand von menschlichen Emotionskommentaren bewertet. Die Ergebnisse zeigen, dass mit einer sehr einfachen Methode die beiden Dimensionen Arousal (.76 UAR) und Valenz (.43 UAR) simuliert werden können.

Eine wissenschaftliche Veröffentlichung der audEERING GmbH.
Mehr Infos auf unserer Forschungsseite