Vergleich der instrumentellen Erfassung der Qualitätsdimension ”Direktheit/Frequenzgehalt“ bei Schmalband- und Breitbandsprache

Conference: Sprachkommunikation 2006 - ITG-Fachtagung
04/26/2006 - 04/28/2006 at Kiel, Germany

Proceedings: Sprachkommunikation 2006

Pages: 4Language: germanTyp: PDF

Personal VDE Members are entitled to a 10% discount on this title

Authors:
Scholz, K.; Huo, L.; Heute, U. (LNS, Christian-Albrechts-Universität, Kaiserstr. 2, 24143 Kiel, Germany)
Wältermann, M. (IKA, Ruhr-Universität Bochum, 44780 Bochum, Germany)
Raake, A. (DT Laboratories, Ernst-Reuter-Platz 7, 10587 Berlin, Germany)

Abstract:
Der Mean-Opinion-Score (MOS) beschreibt die Gesamtqualität, die ein Hörer einem Sprachsignal zuordnet, und kann durch standardisierte instrumentelle Verfahren geschätzt werden. Zur Qualitätsanalyse sind MOS-Werte jedoch nicht ausreichend. Wir entwickeln daher mittels Urteilen über Qualitätsdimensionen ein instrumentelles Verfahren zur Analyse und Beurteilung von Sprachqualit ät. Die Dimensionen erfassen einzelne qualitätsrelevante Störungen und bilden gemeinsam ein Modell für die Gesamtqualität. Für die Qualitätsanalyse von Schmalbandsprache erweist sich u.a. die Dimension ”Direktheit/Frequenzgehalt“ als relevant. Wir stellen einen instrumentellen Schätzer für diese Dimension vor. Die Ergebnisse des Dimensionsschätzers besitzen für die verwendeten Testdaten eine Korrelation von ρ ˜ 0.95 mit den Ergebnissen des entsprechenden auditiven Tests. Des Weiteren wird der Schätzer in einer Pilotstudie auf potentielle Qualitätsdimensionen bei Breitbandsprache angewendet. Dieser Studie zufolge existieren zwei Breitband-Dimensionen, die in Zusammenhang mit der Schmalband-Dimension ” Direktheit/Frequenzgehalt“ stehen: ” Direktheit“ und ” Frequenzgehalt“.