Eignung des Dynamic Time Warping Verfahrens für die Stimmumwandlung

Conference: Sprachkommunikation 2006 - ITG-Fachtagung
04/26/2006 - 04/28/2006 at Kiel, Germany

Proceedings: Sprachkommunikation 2006

Pages: 4Language: germanTyp: PDF

Personal VDE Members are entitled to a 10% discount on this title

Authors:
Leutelt, L.; Heute, U. (LNS / TF /CAU Kiel, 24143 Kiel, Germany)

Abstract:
Diese Arbeit untersucht das Dynamic Time Warping (DTW) Verfahren im Hinblick auf die Eignung zur Ausrichtung von Trainingsdaten für die automatische Stimmumwandlung. In die Untersuchungen werden verschiedene Sprachsignalparametrisierungen, phonetisch motivierte Einschränkungen des Lösungsraums, Frequenzbereichsbetrachtungen und auch Vorwissen über die Lage von Phonemgrenzen einbezogen. Die Güte des Verfahrens wird mit Hilfe eines aus einer phonetischen Transkription abgeleiteten, instrumentellen Maßes bewertet. Es zeigt sich u.a., dass für DTW-Verfahren und Stimmumwandlung die Verwendung unterschiedlicher Sprachsignalparametrisierungen zu empfehlen ist. Insgesamt zeigt der DTW-Algorithmus bei Anwendung auf ganze Sätze trotz der verschiedenen Optimierungen noch einen geringen Anteil signifikanter Fehler, der zu Qualitätseinbußen bei hochqualitativer Stimmumwandlung führen kann.