Integration von Finite State Transducers in das UASR System

Konferenz: Sprachkommunikation 2006 - ITG-Fachtagung
26.04.2006 - 28.04.2006 in Kiel, Germany

Tagungsband: Sprachkommunikation 2006

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Cuevas, M.; Wolff, M.; Werner, S.; Eichner, M.; Hoffmann, R. (Technische Universität Dresden, Institut für Akustik und Sprachkommunikation)

Inhalt:
Im Verlauf der Entwicklung der Sprachsynthetisatoren zu Text-to-Speech Systemen (auch mit spontansprachlichen Elementen) und von Worterkennern zu Erkennern für fließend gesprochene Sätze sind die Datenbasen, auf welche die Systeme zurückgreifen, einander immer ähnlicher geworden. Zugleich stagniert die Leistungsfähigkeit von Spracherkenungs- und –synthesesystemen deutlich unterhalb der Leistungsfähigkeit des Menschen. Die Konvergenz der Datenbasen haben wir im UASR–System (Unified Approach to Speech Synthesis and Recognition) aufgegriffen. Mit Hilfe des Systems sollen vor allem Synergien zwischen Sprachsynthese und Spracherkennungstechnologien aufgedeckt und Fehler identifiziert und lokalisiert werden. In diesem Paper wird auf die spezielle Verwendung von FSTs im UASR–System eingegangen. Die Verwendung von FSTs erlaubt eine Systembetrachtung sowohl innerhalb jeder einzelnen Ebene als auch als ganzheitliches System.