Akustische Synthese mit HMM-kodierten Inventaren

Konferenz: Sprachkommunikation 2010 - 9. ITG-Fachtagung
06.10.2010 - 08.10.2010 in Bochum, Deutschland

Tagungsband: Sprachkommunikation 2010

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Strecha, Guntram (Technische Universität Dresden, Deutschland)

Inhalt:
In diesem Papier ist die akustische Synthese mit HMMkodierten Diphoninventaren beschrieben. Am Beispiel eines deutschen Inventars mit 1175 Diphonen sind die Schritte zur Erstellung eines kodierten sprecherabhängigen Inventars sowie die akustische Synthese mit diesem Inventar dargestellt. Das kodierte Inventar ist in seiner Größe zwischen 68 KByte und 19 KByte skalierbar. Ebenfalls beschrieben ist die Erstellung eines Inventars, dessen Kodebuch Bestandteil der HM-Modelle des Erkenners eines kombinierten Erkennungs- und Synthesesystems ist. Die Synthese mit diesem sprecherunabhängigen Inventar erfordert eine Stimmenkonvertierung. Eine Möglichkeit der Konvertierung ist in diesem Papier dargestellt. Zur Evaluation der Qualität der Synthese mit diesen Inventaren wurde ein MOS-Hörtest durchgeführt. Die Ergebnisse zeigen ähnliche bzw. höhere Bewertungen bei deutlich geringer Inventargröße im Vergleich zu Inventaren, welche mit Standard-Sprachkodierern (AMR, SPEEX) komprimiert wurden.