Digital Signal Processing and System Theory

Talk Friedemann Köster


fko
Instrumentelle Schätzung prosodischer Qualität für synthetisierte Sprachsignale (in German)

Date: 03.05.2012, 13:00 h - 14:00 h, Room: Aquarium

Friedemann Köster
CAU, Kiel, Germany


Details (talk will be in German)



Die vorliegende Diplomarbeit hat das Ziel, Parameter zu finden, mit denen die wahrgenommene prosodische Qualität von synthetischen Sprachsignalen, die mit Text-To-Speech(TTS)-Systemen erstellt worden sind, instrumentell geschätzt werden kann. Zu diesem Zweck werden mit mehreren Verfahren prosodische Parameter der Sprachsignale bestimmt. Nach verschiedenen Vorverarbeitungsmethoden wie der Medianglättung werden aus diesen prosodischen Parametern unterschiedliche Parameter extrahiert. Zunächst werden diese Parameter auf ihre Korrelation mit Qualitätswerten von vorhandenen TTS-Datenbanken überprüft. Anschließend wird mit einem Lernverfahren und einem Regressionsmodell die wahrgenommene Qualität geschätzt und eine Parameterauswahl bestimmt. Abschließend werden aus dieser Parameterauswahl die Parameter selektiert, mit denen die wahrgenommene Qualität von synthetischen Sprachsignalen bestmöglich und robust geschätzt werden kann.