Schnell gesprochene Sprache in der Unit-Selection-Sprachsynthese: Untersuchungen zu Korpuserstellung und -aufbereitung

Konferenz: Sprachkommunikation 2010 - 9. ITG-Fachtagung
06.10.2010 - 08.10.2010 in Bochum, Deutschland

Tagungsband: Sprachkommunikation 2010

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Moers, Donata; Möbius, Bernd; Jauk, Igor; Müllers, Filip (Arbeitsbereich Sprache und Kommunikation der Universität Bonn, 53115 Bonn, Deutschland)
Moers, Donata; Wagner, Petra (Fakultät für Linguistik und Literaturwissenschaft, Universität Bielefeld, Deutschland)
Möbius, Bernd (Institut für Maschinelle Sprachverarbeitung, Universität Stuttgart, Deutschland)

Inhalt:
In diesem Beitrag werden Untersuchungen zur Integration eines Korpus schnell gesprochener Sprache in das Unit-Selection-Synthesesystem BOSS vorgestellt. Hierfür wurden zunächst zwei Synthesekorpora aufgenommen: eines in normalem und eines in schnellem und möglichst deutlichem Sprechtempo. Eine perzeptive Evaluation der Korpusaufnahmen zeigte, dass Stimuli, die aus schnell gesprochener Sprache generiert wurden, hinsichtlich der Verständlichkeit keinen Nachteil gegenüber Stimuli besaßen, die aus normal gesprochener Sprache generiert wurden; bezüglich der Natürlichkeit wurden sie eindeutig bevorzugt. Eine anschließende automatische Segmentierung wies nur marginale Unterschiede in der Segmentierungsgenauigkeit zwischen den beiden Korpusversionen auf. Basierend auf diesen Ergebnissen wurden für beide Korpora CART-basierte Dauervorhersagemodelle erstellt. Die Vorhersagegenauigkeit war für beide Versionen ähnlich gut.