Realisierung von Mischverteilungsdichten durch gewichtete Automaten (Finite-State Transducer)

Conference: Sprachkommunikation 2010 - 9. ITG-Fachtagung
10/06/2010 - 10/08/2010 at Bochum, Deutschland

Proceedings: Sprachkommunikation 2010

Pages: 4Language: englishTyp: PDF

Personal VDE Members are entitled to a 10% discount on this title

Authors:
Duckhorn, Frank; Wolff, Matthias; Hoffmann, Rüdiger (Institut für Akustik und Sprachkommunikation, Technische Universität Dresden, Germany)

Abstract:
Ziel dieser Arbeit ist es, Möglichkeiten zur Verwendung von gewichteten, endlichen, sequenziellen Automaten (weighted Finite-State Transducer) zur Realisierung von Mischverteilungsdichten in Hidden-Markov-Modellen zu untersuchen. Solche Automaten werden in den letzten Jahren immer häufiger in der Sprach- und Mustererkennung eingesetzt. Der Vorteil liegt darin, unterschiedliche Datenbasen und Modelle, welche für Erkennungsaufgaben benötigt werden, durch gleiche Strukturen darzustellen. So können diese vereinigt werden und es müssen keine speziellen Algorithmen verwendet werden. Es existieren Verfahren zur Minimierung und zur Optimierung von gewichteten Automaten sowie zur Dekodierung. Diese können für alle Typen von Modellen einheitlich verwendet werden. Für die Spracherkennung bieten gewichtete Automaten eine einheitliche Realisierung von Hidden-Markov-, Kontextabhänigkeits-, Aussprache- und Sprachmodellen. Diese Arbeit beschäftigt sich mit der Realisierung der Hidden-Markov-Modelle. Dabei wird gewöhnlich nur die Struktur der Zustände und deren Übergänge auf einen Automaten abgebildet. Die den Zuständen oder Übergängen zugeordneten Mischverteilungsdichten bleiben als eigene Struktur bestehen. Wir untersuchen, inwieweit sich diese im allgemeinen Fall der Mustererkennung ebenfalls als Teil eines Automaten abbilden lassen und wie sich das auf die Spracherkennung im Speziellen auswirkt.