Realisierung von Mischverteilungsdichten durch gewichtete Automaten (Finite-State Transducer)

Konferenz: Sprachkommunikation 2010 - 9. ITG-Fachtagung
06.10.2010 - 08.10.2010 in Bochum, Deutschland

Tagungsband: Sprachkommunikation 2010

Seiten: 4Sprache: EnglischTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Duckhorn, Frank; Wolff, Matthias; Hoffmann, Rüdiger (Institut für Akustik und Sprachkommunikation, Technische Universität Dresden, Germany)

Inhalt:
Ziel dieser Arbeit ist es, Möglichkeiten zur Verwendung von gewichteten, endlichen, sequenziellen Automaten (weighted Finite-State Transducer) zur Realisierung von Mischverteilungsdichten in Hidden-Markov-Modellen zu untersuchen. Solche Automaten werden in den letzten Jahren immer häufiger in der Sprach- und Mustererkennung eingesetzt. Der Vorteil liegt darin, unterschiedliche Datenbasen und Modelle, welche für Erkennungsaufgaben benötigt werden, durch gleiche Strukturen darzustellen. So können diese vereinigt werden und es müssen keine speziellen Algorithmen verwendet werden. Es existieren Verfahren zur Minimierung und zur Optimierung von gewichteten Automaten sowie zur Dekodierung. Diese können für alle Typen von Modellen einheitlich verwendet werden. Für die Spracherkennung bieten gewichtete Automaten eine einheitliche Realisierung von Hidden-Markov-, Kontextabhänigkeits-, Aussprache- und Sprachmodellen. Diese Arbeit beschäftigt sich mit der Realisierung der Hidden-Markov-Modelle. Dabei wird gewöhnlich nur die Struktur der Zustände und deren Übergänge auf einen Automaten abgebildet. Die den Zuständen oder Übergängen zugeordneten Mischverteilungsdichten bleiben als eigene Struktur bestehen. Wir untersuchen, inwieweit sich diese im allgemeinen Fall der Mustererkennung ebenfalls als Teil eines Automaten abbilden lassen und wie sich das auf die Spracherkennung im Speziellen auswirkt.