Integration von Finite State Transducers in das UASR System

Conference: Sprachkommunikation 2006 - ITG-Fachtagung
04/26/2006 - 04/28/2006 at Kiel, Germany

Proceedings: Sprachkommunikation 2006

Pages: 4Language: germanTyp: PDF

Personal VDE Members are entitled to a 10% discount on this title

Authors:
Cuevas, M.; Wolff, M.; Werner, S.; Eichner, M.; Hoffmann, R. (Technische Universität Dresden, Institut für Akustik und Sprachkommunikation)

Abstract:
Im Verlauf der Entwicklung der Sprachsynthetisatoren zu Text-to-Speech Systemen (auch mit spontansprachlichen Elementen) und von Worterkennern zu Erkennern für fließend gesprochene Sätze sind die Datenbasen, auf welche die Systeme zurückgreifen, einander immer ähnlicher geworden. Zugleich stagniert die Leistungsfähigkeit von Spracherkenungs- und –synthesesystemen deutlich unterhalb der Leistungsfähigkeit des Menschen. Die Konvergenz der Datenbasen haben wir im UASR–System (Unified Approach to Speech Synthesis and Recognition) aufgegriffen. Mit Hilfe des Systems sollen vor allem Synergien zwischen Sprachsynthese und Spracherkennungstechnologien aufgedeckt und Fehler identifiziert und lokalisiert werden. In diesem Paper wird auf die spezielle Verwendung von FSTs im UASR–System eingegangen. Die Verwendung von FSTs erlaubt eine Systembetrachtung sowohl innerhalb jeder einzelnen Ebene als auch als ganzheitliches System.