SynthetischesMulticondition-Training zur robusten Erkennung verhallter Sprache

Konferenz: Sprachkommunikation 2006 - ITG-Fachtagung
26.04.2006 - 28.04.2006 in Kiel, Germany

Tagungsband: Sprachkommunikation 2006

Seiten: 4Sprache: DeutschTyp: PDF

Persönliche VDE-Mitglieder erhalten auf diesen Artikel 10% Rabatt

Autoren:
Sehr, Armin; Greß, Oliver; Kellermann, Walter (Lehrstuhl für Multimediakommunikation und Signalverarbeitung, Universität Erlangen-Nürnberg, Cauerstr. 7, 91058 Erlangen)

Inhalt:
Dieser Beitrag untersucht experimentell die Abhängigkeit der Erkennungsrate eines kontinuierlichen Spracherkenners mit großem Wortschatz von der Nachhallzeit in realen Umgebungen. Zur Verbesserung der Robustheit gegenüber Nachhall wird ein neuartiges, besonders aufwandsgünstiges Trainingsverfahren, das sogenannte synthetischeMulticondition-Training, vorgestellt und mit anderenMethoden des verhallten Trainings verglichen. In diesem Vergleich erreicht das synthetische Multicondition-Training die robustesten Modelle, die in unterschiedlichen Umgebungen und über einen großen Bereich von Nachhallzeiten deutliche Verbesserungen der Erkennungsraten gegenüber unverhalltem Training erzielen.