Eignung des Dynamic Time Warping Verfahrens für die Stimmumwandlung

Konferenz: Sprachkommunikation 2006 - ITG-Fachtagung
26.04.2006 - 28.04.2006 in Kiel, Germany

Tagungsband: Sprachkommunikation 2006

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Leutelt, L.; Heute, U. (LNS / TF /CAU Kiel, 24143 Kiel, Germany)

Inhalt:
Diese Arbeit untersucht das Dynamic Time Warping (DTW) Verfahren im Hinblick auf die Eignung zur Ausrichtung von Trainingsdaten für die automatische Stimmumwandlung. In die Untersuchungen werden verschiedene Sprachsignalparametrisierungen, phonetisch motivierte Einschränkungen des Lösungsraums, Frequenzbereichsbetrachtungen und auch Vorwissen über die Lage von Phonemgrenzen einbezogen. Die Güte des Verfahrens wird mit Hilfe eines aus einer phonetischen Transkription abgeleiteten, instrumentellen Maßes bewertet. Es zeigt sich u.a., dass für DTW-Verfahren und Stimmumwandlung die Verwendung unterschiedlicher Sprachsignalparametrisierungen zu empfehlen ist. Insgesamt zeigt der DTW-Algorithmus bei Anwendung auf ganze Sätze trotz der verschiedenen Optimierungen noch einen geringen Anteil signifikanter Fehler, der zu Qualitätseinbußen bei hochqualitativer Stimmumwandlung führen kann.