Förderpreis 2020 - Euha.org

Die Seite wird erstellt Thorsten Hohmann
 
WEITER LESEN
Förderpreis 2020 - Euha.org
 

           EUROPÄISCHE UNION DER HÖRAKUSTIKER e. V.  

                 Förderpreis 2020
  
      Vergleich von fünf Sprachtests im
     sprachsimulierenden Störgeräusch

                                      Bachelorarbeit

                        Verfasserin: Christina Zinner
                  Erstprüferin: Prof. Dr. Inga Holube
                Zweitprüfer: Prof. Dr. Martin Hansen
               Datum der Abgabe: 12. Februar 2020
Förderpreis 2020 - Euha.org
Bachelorarbeit im Studiengang Hörtechnik und Audiologie
Abteilung Technik und Gesundheit für Menschen
Fachbereich Bauwesen Geoinformation Gesundheitstechnologie
Jade Hochschule Wilhelmshaven/Oldenburg/Elsfleth

Herausgeber: Europäische Union der Hörakustiker e. V.
Neubrunnenstraße 3, 55116 Mainz, Deutschland
Tel. +49 (0)6131 28 30-0
Fax +49 (0)6131 28 30-30
E-Mail: info@euha.org
Internet: www.euha.org

Alle hier vorhandenen Daten, Texte und Grafiken sind urheberrechtlich geschützt. Eine Verwertung
über den eigenen privaten Bereich hinaus ist grundsätzlich genehmigungspflichtig.

© EUHA 2020
Förderpreis 2020 - Euha.org
Kurzfassung

In Deutschland stehen mehrere Sprachtestverfahren zur Verfügung, die jeweils mit unter-
schiedlichen Störgeräuschen und teils auch anderen Kalibrierungsverfahren verwendet wer-
den. Dadurch können Vergleiche zwischen den jeweiligen Ergebnissen nur bedingt erfolgen.
Zur Untersuchung der Unterschiede zwischen dem Freiburger Einsilbertest (FBE), dem Ol-
denburger Satztest (OLSA), dem Göttinger Satztest (GÖSA), dem Hochmair-Schulz-Moser-
Satztest (HSM) und dem Reimtest nach von Wallenberg und Kollmeier (WAKO) wurden
deshalb die Messbedingungen angeglichen. Zum einen wurden alle Sprachmaterialien auf
den gleichen mittleren Langzeitpegel kalibriert. Zum anderen wurden neue sprachsimulie-
rende Rauschen aus den Sprachmaterialien generiert, indem das Sprachmaterial 30fach
überlagert wurde. Diese sprachsimulierenden Rauschen (engl.: speech adjusted noise, SAN)
weichen zum Teil deutlich vom Spektrum der standardmäßig verwendeten Rauschen (STD)
ab. Das Sprachverstehen in den STD- und SAN-Rauschen wurde mit 22 jungen Probanden
ohne Hörbeeinträchtigungen im Freifeld ermittelt. Sowohl die Sprache als auch das Störge-
räusch wurden über einen Lautsprecher aus der 0°-Richtung dargeboten. Jedes der fünf
Sprachmaterialien wurde in den Störgeräuschen bei jeweils mindestens drei Signal-Rausch-
Abständen (SNR) präsentiert. An die Messergebnisse wurden Diskriminationsfunktionen
angepasst und die Schwelle für 50%iges Sprachverstehen (SRT50) ermittelt. Bei Verwen-
dung der SAN-Rauschen wichen die SRT50-Werte der fünf Sprachmaterialien um maximal
2,6 dB voneinander ab. Die Differenz zu den SRT50-Werten für die STD-Rauschen war für
den HSM mit 4,0 dB am größten und betrug beim GÖSA lediglich 0,7 dB. Die ermittelten
(UJHEQLVVH NRQQWHQ GXUFK GHQ Ä6SHHFK ,ntelligibility Index³ (SII) nur bedingt nachgebildet
werden.

Stichwörter: Sprachtest, Störgeräusch, sprachsimulierend, OLSA, FBE, GÖSA, WAKO,
HSM, SII

Abstract

There are several speech tests available in Germany. They are often used with different
background noises and sometimes also with different calibration methods. Therefore, com-
parisons between the respective results can only be made conditionally. To investigate the
differences between the Freiburg monosyllabic test (FBE), Oldenburg (OLSA) and Götting
sentences test, Hochmair-Schulz-Moser sentences test (HSM), and rhyme test according to
von Wallenberg and Kollmeier (WAKO), the measurement conditions were adjusted. First, all
speech materials were calibrated to the same average long-term level. On the other hand,
new speech-simulating noises were generated from the speech materials. For this purpose,
the speech material was overlaid 30 times. These speech-adjusted noises (SAN) sometimes
differ significantly from the spectrum of the standard noises (STD). The speech intelligibility
in the STD- and SAN-noises was measured with 22 young and normal-hearing persons in
freefield conditions. Both, the speech and the background noise, were presented via a loud-
speaker from the 0 ° direction. Each of the five speech materials were presented in the back-
ground noise with at least three signal-to-noise ratios. Discrimination functions were adapted
to the measurement results and the speech reception thresholds for a speech intelligibility of
50 % were determined. When using SAN noise, the SRT50 values of the five speech materi-
als differed by a maximum of 2.6 dB. The difference to the SRT50 values for the STD noise
was largest for the HSM with 4.0 dB and was only 0.7 dB for the GÖSA. The speech intelligi-
bility index (SII) only partially replicated the results!

Keywords: speech test, background noise, speech adjusted, OLSA, FBE, GÖSA, WAKO,
HSM, SII
Förderpreis 2020 - Euha.org
Inhaltsverzeichnis
1!          Einleitung .................................................................................................................... 1!
2!          Theoretischer Hintergrund .......................................................................................... 3!
     2.1!      Sprachverstehen ..................................................................................................... 3!
     2.2!         Einflussfaktoren auf das Sprachverstehen ........................................................... 3!
     2.2.1!       Einfluss des Sprachmaterials auf das Sprachverstehen....................................... 3!
     2.2.2!       Einfluss des Störgeräuschs auf das Sprachverstehen ......................................... 4!
     2.2.3!       Individuelle Einflüsse auf das Sprachverstehen ................................................... 6!
     2.3!      Gesetzliche Grundlagen .......................................................................................... 7!
     2.4!      Sprachmaterial im Vergleich.................................................................................... 7!
     2.5!      Störgeräusche im Vergleich ...................................................................................13!
     2.6!      Literaturwerte des Sprachverstehens im Vergleich .................................................15!
     2.7!      Speech Intelligibility Index (SII) ..............................................................................15!
3!          Hypothesen ...............................................................................................................17!
4!          Methodik ....................................................................................................................18!
     4.1!      Probanden .............................................................................................................18!
     4.2!      Erzeugung des Rauschens ....................................................................................19!
     4.3!      Bewertung der Qualität des SAN-Rauschens .........................................................19!
     4.4!      Randomisierung .....................................................................................................21!
     4.5!      Messaufbau ...........................................................................................................21!
     4.6!      Pilotstudie ..............................................................................................................24!
     4.6.1!       Stimuli.................................................................................................................24!
     4.6.2!       Ergebnisse..........................................................................................................24!
     4.7!      Hauptstudie ............................................................................................................25!
     4.8!      Statistische Methoden ............................................................................................26!
     4.9!      SII-Berechnung ......................................................................................................27!
5!          Ergebnisse.................................................................................................................29!
     5.1!      Verstehen in Abhängigkeit vom SNR .....................................................................29!
     5.2!      SRT50-Schwellen ....................................................................................................31!
     5.3!      S50 ..........................................................................................................................35!
     5.4!      SII ..........................................................................................................................37!
6!          Analyse der Testergebnisse ......................................................................................39!
     6.1!      Vergleich der Messergebnisse im STD-Rauschen .................................................39!
     6.2!      Vergleich der Messergebnisse im SAN-Rauschen .................................................40!
     6.3!      Vergleich der SRT50-Schwellen innerhalb der Sprachtests .....................................42!
     6.4!      Vergleich der s50 innerhalb der Sprachtests ...........................................................46!
     6.5!      SII ..........................................................................................................................48!
7!          Diskussion .................................................................................................................50!
     7.1!      SAN-Rauschen ......................................................................................................50!
Förderpreis 2020 - Euha.org
7.2!      Kalibrierung ............................................................................................................50!
     7.3!      SRT50-Schwelle ......................................................................................................51!
     7.4!      S50 ..........................................................................................................................51!
     7.5!      SII ..........................................................................................................................51!
     7.6!      Bezug zu gesetzlichen Grundlagen ........................................................................52!
8!          Fazit und Ausblick......................................................................................................53!
     Anhang A: Dokumente für die Messdurchführung ............................................................... I!
     Anhang B: Abbildungen .................................................................................................... VI!
     Anhang C: Tabellen ........................................................................................................ XIX!
     Abbildungsverzeichnis ............................................................................................... XXVIII!
     Tabellenverzeichnis .................................................................................................... XXXII!
     Abkürzungsverzeichnis .............................................................................................. XXXIV!
Literaturverzeichnis ........................................................................................................ XXXV!
Förderpreis 2020 - Euha.org
1 Einleitung

Die Sprache ist das wichtigste menschliche Mittel, um Informationen auszutau-
schen. Daher spielt auch das Sprachverstehen in der zwischenmenschlichen Kom-
munikation eine entscheidende Rolle. Dieses ist im Alltag jedoch häufig durch Stör-
geräusche erschwert. Insbesondere Personen mit Hörbeeinträchtigung stoßen oft-
mals an ihre Grenzen, wenn es heißt, Sprache in geräuschvoller Umgebung zu ver-
stehen. Für die Unterscheidung zwischen der Normal- und Schwerhörigkeit reicht es
dementsprechend nicht aus, nur die Tonhörschwelle mittels Tonaudiogramm zu
messen. Auch die Messung des Sprachverstehens leistet einen Beitrag zur Erken-
nung und Einstufung einer Schwerhörigkeit.

Für die Ermittlung des Sprachverstehens stehen im deutschsprachigen Raum meh-
rere Testverfahren zur Verfügung. Neben dem Freiburger Einsilbertest (FBE:
Hahlbrock, 1953), dem Oldenburger (OLSA: Wagener et al., 1999a, b, c) und dem
Göttinger Satztest (GÖSA: Kollmeier und Wesselkamp, 1997), können auch der
Hochmair-Schulz-Moser-Satztest (HSM: Schmidt et al., 1997) und der Reimtest
nach von Wallenberg und Kollmeier (WAKO: von Wallenberg und Kollmeier, 1989
aus Sotscheck, 1982) verwendet werden. Jedoch unterscheiden sich diese Sprach-
tests in vielerlei Punkten, wie zum Beispiel im Sprachmaterial und der Art der Durch-
führung. Während es sich bei den nachzusprechenden Sätzen des OLSA um sinn-
leeres Sprachmaterial handelt, sind die Sätze des GÖSA und HSM sinnbehaftet. Im
Gegensatz dazu werden bei den Messungen des FBE oder WAKO nur einsilbige
Wörter dargeboten, die wiederum nachgesprochen (FBE) oder aus fünf Antwortal-
ternativen ausgewählt (WAKO) werden.

Aber auch das dabei verwendete Störgeräusch und die Kalibrierung der Sprache
und des Rauschens unterscheiden sich. Diese Unterschiede zeigen sich auch in
den Messergebnissen der jeweiligen Sprachtests. So konnten beispielsweise Wink-
ler und Holube (2018) nachweisen, dass das Sprachverstehen von Einsilbern signi-
fikant vom verwendeten Störgeräusch abhängt. Von Winkler und Holube (2016) wird
der Einfluss der Kalibrierung auf das Messergebnis und seine Vergleichbarkeit mit
anderen Sprachtests beschrieben.

Zusammenfassend kann festgehalten werden, dass es eine Vielzahl an möglichen
Sprachtests in unterschiedlichen Konditionen gibt. Die daraus entstehenden Ergeb-
nisse sind jedoch nicht immer einwandfrei miteinander vergleichbar. Sowohl das
Sprachmaterial, als auch die Art des Störgeräuschs und die Kalibrierung spielen
dabei eine entscheidende Rolle. Die vorliegende Arbeit beschäftigt sich deshalb mit
der Frage, ob die Ergebnisse dieser Sprachtests besser miteinander vergleichbar
sind, wenn die Störrauschen und die Kalibrierungen aufeinander abgestimmt sind.

Zu Anfang dieser Bachelorarbeit wird ein Überblick des theoretischen Hintergrunds
gegeben. Dazu wird zuerst GHU%HJULIIGHVÄ6SUDFKYHUVWHKHQV³ definiert und dessen
Messverfahren beschrieben. Anschließend werden mögliche Einflussfaktoren auf
das Sprachverstehen näher erläutert. Dazu gehören neben dem verwendeten
Sprachmaterial und Störgeräusch auch die individuellen Einflüsse des Probanden.
Nach der Erläuterung der gesetzlichen Grundlagen, erlaubt ein Vergleich ausge-
wählter zur Verfügung stehender Sprachmaterialien und Störgeräusche einen Ein-
blick in die Sprachtestverfahren im deutschsprachigen Raum. Anschließend werden
Literaturwerte der zu untersuchenden Sprachtests in ihrer standardmäßigen Durch-
führung gezeigt. Zum Schluss wird GHUÄ6SHHFK,QWHOOLJLELOLW\,QGH[³ 6,, DOVREMHNWi-
ves Maß zur Vorhersage des Sprachverstehens vorgestellt.

                                                                              Seite | 1
Förderpreis 2020 - Euha.org
Im nachfolgenden Kapitel 3 werden die Hypothesen beschrieben, auf Basis derer
diese Studie durchgeführt wurde. Danach wird XQWHU GHP 3XQNW Ä0HWKRGLN³ das
praktische Vorgehen erläutert. Dazu gehören auch die Auswahlkriterien der beteilig-
ten Probanden. Außerdem wird die Generierung von sprachsimulierenden Rau-
schen beschrieben, welche die Vergleichbarkeit der Testverfahren steigern sollen.
Einen weiteren Aspekt der Methodik stellt die Kalibrierung dar, welche sich in der
standardmäßigen Durchführung der Tests unterscheiden kann. Des Weiteren wird
die zur Vermeidung von systematischen Fehlern angewandte Randomisierung der
Messkonditionen thematisiert. Die Messaufbauten werden schließlich mit allen ver-
wendeten Geräten für die Ton- und Sprachaudiometrie gezeigt. Der letzte Teil der
Methodik beschäftigt sich mit der Durchführung der Pilot- und Hauptstudie.

Die Ergebnisse der Messreihe werden in Kapitel 5 gezeigt und beschrieben. Darauf
aufbauend erfolgt die Auswertung und Diskussion, bevor abschließend ein Fazit
gezogen wird.

                                                                          Seite | 2
Förderpreis 2020 - Euha.org
2 Theoretischer Hintergrund
   2.1 Sprachverstehen

'HILQLWLRQGHV%HJULIIVÄ6SUDFKYHUVWHKHQ³

Der Begriff des Sprachverstehens beschreibt im Allgemeinen die Fähigkeit die Laut-
folge eines Wortes oder eines Satzes zu erkennen und wiederholen zu können. In
der Literatur wird zwischHQ Ä6SUDFKYHUVWHKHQ³ XQG Ä6SUDFKYHUVWlQGOLFKNHLW³ XQWHr-
schieden. Jedoch ergeben sich je nach Quelle XQWHUVFKLHGOLFKH'HILQLWLRQHQÄ,QGHQ
Sprachwissenschaften bezieht sich die Sprachverständlichkeit auf die phonetisch-
phonologische Struktur eines Wortes oder eines Satzes, wohingegen Sprachver-
ständnis oder -verstehen mit der Erfassung von Sinn und Bedeutung von Wörtern
XQG6lW]HQ]XWXQKDEHQ³ +RWK  Im Gegensatz dazu schreiben Hoppe und
Hast (2017), mit dem TerPLQXV Ä9HUVWHKHQ³ VHL OHGLJOLFK GLH NRUrekte auditive Er-
kennung der Lautfolgen und nicht das tiefere Verständnis für die Sprache gemeint.
Nachfolgend wird das ÄSprachverstehen³ im Sinne der Definition von Hoppe und
Hast (2017) verwendetZlKUHQGPLWÄ6SUDFKYHUVWlQGOLFKNHLW³DXFKGHU tiefere Sinn
und die Bedeutung von Sprache gemeint ist.

Messung des Sprachverstehens

Zur Messung des Sprachverstehens stehen im deutschsprachigen Raum mehrere
Verfahren zur Auswahl. Abhängig vom Alter und den sprachlichen Kenntnissen des
Patienten, wird zwischen Sprachtests für Kinder und Erwachsene unterschieden. Zu
den bekanntesten Sprachtests gehören der FBE (Hahlbrock, 1953), der OLSA (Wa-
gener et. al, 1999a, b, c) sowie der GÖSA (Kollmeier und Wesselkamp, 1997). Die-
se sind auch nach der Hilfsmittelrichtlinie (2012/2018) als Sprachtestverfahren zur
Überprüfung der Indikation und des Versorgungsergebnisses zugelassen. Beson-
ders verbreitet ist der Freiburger Sprachtest, der sowohl in HNO-Praxen und Klini-
ken, wie auch bei Hörakustikern Anwendung findet. Trotz vieler Kritikpunkte wird
dieser seit den 1950er Jahren standardmäßig durchgeführt. Die alternativen Satz-
tests OLSA und GÖSA sind dagegen weniger etabliert, was vermutlich auch an de-
ren Anschaffungskosten liegt. Weitere Sprachtests sind der HSM (Schmidt et al.,
1997) und der WAKO (von Wallenberg und Kollmeier, 1989). Während der HSM
hauptsächlich zur Messung des Sprachverstehens bei Cochlea-Implantat-Patienten
(CI-Patienten) verwendet wird, findet der WAKO derzeit kaum praktisch Anwen-
dung.

Es ist zu unterscheiden, ob das Sprachverstehen in Ruhe oder im Störgeräusch
ermittelt wird. Während der Freiburger Sprachtest für die Messung in Ruhe ausge-
legt ist, werden die anderen Sprachtests vorwiegend im Störgeräusch gemessen.
Zur Anpassung und Überprüfung eines Hörgeräts ist durch die Hilfsmittelrichtlinie
sowohl die Messung des Sprachverstehens in Ruhe als auch im Störgeräusch vor-
geschrieben.

   2.2 Einflussfaktoren auf das Sprachverstehen

Das Sprachverstehen wird durch eine Vielzahl von Faktoren beeinflusst. Neben in-
dividuellen Einflüssen des Probanden, gehören vor allem die Art des Sprachmateri-
als und des Störgeräuschs dazu. Diese Kriterien werden nachfolgend näher be-
leuchtet.

       2.2.1   Einfluss des Sprachmaterials auf das Sprachverstehen
Das Sprachmaterial hat bei der Messung des Sprachverstehens einen entscheiden-
den Einfluss. Im ersten Schritt kann zwischen Logatomen, Worten und Sätzen un-
terschieden werden. Dabei steigt in genannter Reihenfolge auch die Anzahl und
                                                                             Seite | 3
Förderpreis 2020 - Euha.org
Komplexität kognitiver Prozesse (Steffens, 2017). Erklärt werden kann dies bei-
spielsweise durch die Merkspanne des Patienten, die für ganze Sätze größer sein
muss, als bei einzelnen Worten, um die entsprechenden Testitems wiederholen zu
können.

Auch die Bewertung der zu wiederholenden Testitems ist dabei entscheidend. Wird
bei einem Satztest anstelle jedes einzelnen Wortes der ganze Satz gewertet, wird
das Verstehen bei identischem Pegel und Signal-Rausch-Verhältnis (engl.: signal to
noise ratio, SNR) unterschätzt. So wird beispielsweise ein Satz mit nur einem falsch
wiedergegebenen Wort nach dem Alles-oder-Nichts-Prinzip als falsch eingestuft,
wenn er als Ganzes gewertet wird. Bei der Wertung einzelner Wörter kann dagegen
auch ein Teilverstehen erreicht werden.

Ein Indikator für die Anzahl statistisch unabhängiger Testitems innerhalb eines
Trials ist der sogenannte j-Faktor, welcher sich gemäß
                                           ࢒࢕ࢍሺ࢖ ሻ
                                      ࢐ ൌ  ࢒࢕ࢍሺ࢖ࡳሻ                                 ( 1)
                                                 ࢀ

berechnet (Boothroyd und Nittrouer, 1988). Dabei beschreibt pG die Wahrscheinlich-
keit den ganzen Trial (z.B. den ganzen Satz) zu verstehen, während mit pT diejenige
Wahrscheinlichkeit gemeint ist, mit der ein Teil des Ganzen (z.B. ein Wort aus ei-
nem Satz) verstanden wird. So kann beispielsweise bei sinnhaften Sätzen allein
aufgrund des Rückschließens von einigen Worten auf andere die Verständlichkeit
steigen, obwohl das Verstehen nicht besser ist. Dieses Rückschließen auf nicht ver-
VWDQGHQH /DXWIROJHQ PLW +LOIH GHV ULFKWLJ JHIXQGHQHQ 6LQQV ZLUG DOV ÄHNOHNWLVFKH
KombinaWLRQ³EH]HLFKQHW +DKOEURFN Nach Wagener et al. (1999c) folgt aus
einem höheren j-Faktor außerdem eine gesteigerte Messgenauigkeit, da in einem
bestimmten Zeitintervall der Messung mehr Informationen des Sprachverstehens
ermittelt werden können.

Einen weiteren Einflussfaktor auf das Sprachverstehen stellt der Trainingseffekt dar
(Wagener et al., 1999c; Schlüter et al., 2012). Bei mehrfacher Wiederholung eines
Sprachtests kann es zu einer gewissen Übung im Testmaterial kommen, die den
Probanden über mehrere Durchläufe hinweg besser werden lässt. Dieser Effekt
spielt vor allem dann eine wichtige Rolle, wenn der Aufbau des Sprachtests immer
gleich ist, wie es zum Beispiel bei Matrix-Tests der Fall ist. Dabei werden Sätze in
immer gleicher Satzstruktur getestet, welche sich der Proband im Verlauf einiger
Messungen aneignen kann. Vor allem die begrenzte Auswahl an Testwörtern führt
zu einem Lerneffekt. Werden dagegen immer verschiedene Wörter und Sätze un-
terschiedlichen Aufbaus getestet, bleibt der Trainingseffekt nur gering oder entfällt
komplett.

Zudem ist das Sprachverstehen davon abhängig, ob das Testitem dem Probanden
bekannt ist (Baljic et al., 2016). Kennt dieser das dargebotene Wort nicht, fällt es
entsprechend schwerer, dieses korrekt zu wiederholen. Im Gegensatz dazu können
geläufige Wörter teilweise auch dann korrekt wiederholt werden, wenn sie nicht voll-
ständig verstanden wurden.

       2.2.2 Einfluss des Störgeräuschs auf das Sprachverstehen
Beim Vergleich der Literatur (z.B. Wagener und Brand, 2005; Wagener et al., 2006;
Holube et al., 2017; Winkler und Holube, 2018; Holube et al., 2019) fällt auf, dass es
sehr viele verschiedene Rauscharten gibt, die sich zum Teil nur geringfügig, teilwei-
se jedoch auch grundsätzlich unterscheiden. Prinzipiell können Störgeräusche nach
bestimmten Kriterien eingeordnet werden, die zu unterschiedlichen Maskierungsef-
fekten führen. Diese Unterkategorien werden nachfolgend genauer beschrieben.

                                                                                 Seite | 4
Förderpreis 2020 - Euha.org
Fluktuierende und stationäre Störgeräusche
Fluktuierende Störgeräusche weisen im Verlauf der Zeit Schwankungen der Hüll-
kurvenamplitude auf. Dieses zeitliche Verhalten liegt auch bei natürlicher Sprache
YRU 'DGXUFK NRPPW HV ]X Ä5DXVFKSDXVHQ³ bzw. leiseren Rauschanteilen, ähnlich
wie fließende Sprache leise Sprachanteile und Pausen zwischen Wörtern beinhaltet.
Diese kurzen Absenkungen der Rauschleistung fehlen bei stationären Störgeräu-
schen. Stattdessen weisen diese eine im Mittel gleichbleibende Leistung über der
Zeit auf.

Für Normalhörende können sich zeitliche Lücken im Störgeräusch als nützlich er-
weisen, wenn sie simultan dargebotene Sprache verstehen wollen. Dann kommt es
]XP VRJHQDQQWHQ Ä'LS-/LVWHQLQJ³ RGHU ÄJOLPSVLQJ³ (Miller und Licklider, 1950; Ho-
ward-Jones und Rosen, 1993, Vestergaard et al., 2011), also zum Hören in den
Lücken. Dadurch kann sich das Verstehen für Normalhörende im Vergleich zu stati-
onärem Rauschen enorm verbessern (Wagener et al., 2006). In diesem Zusam-
PHQKDQJ ZXUGH GDV 3KlQRPHQ GHV ÄComodulation Masking Release³ (CMR) von
Hall et al. (1984) beschrieben: Dieses führt zu einer Verbesserung der Signaldetek-
tion, indem Informationen aus anderen Frequenzbereichen, außerhalb des kriti-
schen Bandes des Signals, verwendet werden. Demnach kann eine Differenz zwi-
schen den Bändern insbesondere dann erfasst werden, wenn die Modulationsmus-
ter des Störgeräuschs bänderübergreifend ähnlich sind. Komodulation bezeichnet
dabei die frequenzübergreifende Kohärenz eines Signals (Hall et al., 1984).

Für Personen mit Hörbeeinträchtigung kommt es nach Holube et al. (1997) jedoch
zu einer Aufspaltung in zwei Gruppen. Eine Gruppe kann die Maskiererlücken ähn-
lich gut nutzen wie Normalhörende. Der andere Teil kann dagegen keinen Vorteil
aus den Rauschpausen ziehen (Holube et al., 1997). Als Grund für den ausbleiben-
den Verständnisgewinn durch die Lücken im Maskierer nennen Wagener et al.
(2001) die geringe Hörbarkeit hörbeeinträchtigter Personen in Ruhe. Dieses verhält
sich demnach wie internes Rauschen, das auch in den Rauschpausen zu Maskie-
rung führt. Als zusätzliche Faktoren für den geringen Nutzen von Dip-Listening bei
Schwerhörigkeit, nennen Festen und Plomp (1990) die reduzierte zeitliche Auflö-
sung und das reduzierte CMR.

Energetische und informationelle Maskierung

Auch der Informationsgehalt des Maskierers spielt für seine Maskierungswirkung
HLQHHQWVFKHLGHQGH5ROOH3ULQ]LSLHOOZLUG]ZLVFKHQÄHQHUJHWLVFKHQ³XQGÄLQIRUPDWLo-
QHOOHQ³0DVNLHUHUQXQWHUVFKLHGHQ (Brungart, 2001; Arbogast et al., 2002). Energeti-
sche Maskierung tritt immer dann auf, wenn die Maskiererleistung, oder ein Teil
davon, in die gleichen auditorischen Filter fällt wie die Signalleistung (Arbogast et
al., 2002). Dadurch wird das zu hörende Signal im auditorischen System weniger
detailOLHUW ÄGDUJHVWHOOW³ XQG LVW HQWVSUHFKHQG VFKOHFKWHU ]X GHWHNWLHUHQ RGHU zu ver-
stehen. Die energetische oder auch periphere Maskierung nimmt dabei mit steigen-
dem SNR monoton ab (Brungart, 2001). Informationsmaskierung tritt im Gegensatz
dazu auch ohne oder zusätzlich zu den überlappenden Spektren von Signal und
Maskierer auf (Arbogast et al., 2002). Nach Brungart (2001 LVWEHLÄLQIRUPDWLRQHOOHU
0DVNLHUXQJ³ VRZRKO GDV 6LJQDO, als auch das Störgeräusch hörbar. Diese können
jedoch auf einer höheren kognitiven Ebene nicht voneinander getrennt werden.
Hierbei ist zu beachten, dass informationelle Störgeräusche in der Regel auch einen
energetischen Maskierungseffekt besitzen (Helfer und Freyman, 2008).

Sprachsimulierende Rauschen

Als sprachsimulierend wird ein Störgeräusch immer dann bezeichnet, wenn es das
gleiche mittlere Langzeitspektrum wie Sprache besitzt. Dies kann durch entspre-

                                                                                    Seite | 5
chende Filterung eines Rauschens, oder durch Generierung des Störsignals aus der
Sprache erreicht werden. Das zeitliche Muster von Sprache wird bei sprachsimulie-
rendem Rauschen jedoch nicht simuliert. Als Beispiel für ein aus dem Sprachmate-
rial generiertes Rauschen können das OLnoise (Wagener et al., 1999a) und das
GÖnoise (Kollmeier und Wesselkamp, 1997) angeführt werden. Diese sind im zeitli-
chen Verlauf stationär und weisen entsprechend keine zeitlichen Lücken oder Leis-
tungsschwankungen auf, wie sie in einem Sprachsignal enthalten sind. Weil das
Rauschen keine verständliche Sprache enthält, handelt es sich hier um rein energe-
tische Maskierung ohne informationellen Anteil.

Pegel des Rauschens

Wie bei Sprache ist auch der Pegel des Störgeräuschs maßgeblich für das Sprach-
verstehen. Dabei ist der Schalldruckpegel nicht absolut, sondern relativ zur individu-
ellen Hörschwelle des Probanden zu sehen. Liegt der Maskierungspegel unter der
Hörschwelle, so ist der Maskierer nicht mehr wahrzunehmen und seine Wirkung
entfällt. In diesem Fall wären die Messergebnisse gleich denen, die aus einer Mes-
sung in absoluter Ruhe hervorgehen (Persson et al., 2001; Thiele et al., 2011).

Außerdem ist der Pegel des Störgeräuschs relativ zum Sprachpegel zu betrachten.
Bei der Messung des Sprachverstehens ist vor allem die Relation zwischen beiden,
also der SNR, relevant. So wird in der Literatur eingehend beschrieben, dass in ei-
nem Pegelbereich von 45 dB SPL bis 80 dB SPL der absolute Pegel des Raus-
chens kaum Einfluss auf das Sprachverstehen hat, sondern dass es nur vom ange-
wandten SNR abhängt (z.B.: Wagener und Brand, 2005; Hawkins und Stevens,
1950; Hirsh und Bowman, 1953).

Kontinuität des Rauschens

Ein weiterer Einflussfaktor auf das Sprachverstehen stellt auch die Kontinuität des
Störgeräuschs dar. Mit Kontinuität ist in diesem Zusammenhang gemeint, dass das
Rauschen auch zwischen den Testitems durchgehend dargeboten wird. Schwellen,
die kontinuierlichen anstatt mit unterbrochenen Maskierer ermittelt werden, sind zu
niedrigeren SNR-Werten verschoben (Hirsh und Bowman, 1953; Hall et al., 2002;
Wagener et al., 2001; Wagener und Brand, 2005). Demnach fällt es Probanden
leichter das Störgeräusch auszublenden und damit Sprache zu verstehen, wenn es
sich um ein gleichbleibendes Rauschen handelt. Wagener und Brand (2005) ermit-
telten eine Differenz von 1,4 dB in Abhängigkeit davon, ob das Maskierungsrau-
schen kontinuierlich oder unterbrochen abgespielt wurde.

       2.2.3 Individuelle Einflüsse auf das Sprachverstehen
Neben dem Sprachmaterial und dem Störgeräusch hat auch der Proband selbst
Einfluss auf das gemessene Sprachverstehen. Vor allem das individuelle Hörver-
mögen spielt dabei eine entscheidende Rolle. Je nach Grad und Verlauf der Hör-
schwellen kann das Verstehen sehr unterschiedlich ausfallen (Thiele et al., 2011).
Erhöhte Hörschwellen treten häufig bei älteren Personen auf, sodass sich ihr
Sprachverstehen im Vergleich zu jüngeren Personen verschlechtert. Jedoch ist mit
erhöhtem Lebensalter auch oftmals eine schnellere Ermüdung der Probanden zu
beobachten (Holtzer et al., 2011), welche in der Folge zu verringertem prozentualem
Verstehen führen kann. Nüsse et al. (2015) beschreiben zudem einen Zusammen-
hang des Sprachverstehens mit der kognitiven Leistungsfähigkeit, sodass mit ab-
nehmenden kognitiven Ressourcen auch das Verstehen schlechter wird. Ein weite-
rer Einflussfaktor auf das individuelle Sprachverstehen ist der Wortschatz der zu
untersuchenden Person. So sind Worte, die dem Probanden unbekannt sind,
schwerer zu verstehen, als bekannte Worte (Baljic et al., 2016). Dieser Effekt ist
unter anderem auf die ausbleibende eklektische Kombination zurückzuführen, wel-

                                                                             Seite | 6
che für unbekannte Worte nicht möglich ist. Der Wortschatz wird in der Regel vor
der Untersuchung nicht untersucht, kann jedoch unter Berücksichtigung von Alter,
regionaler Herkunft und Bildungsniveau abgeschätzt werden (Steffens, 2017). Nicht
zuletzt stellt auch die Motivation des Probanden einen Einflussfaktor auf das Ver-
stehen von Sprache dar.

    2.3 Gesetzliche Grundlagen

Um sicher zu stellen, dass Versicherte in Deutschland ausreichend, zweckmäßig
und wirtschaftlich mit Hilfsmitteln versorgt werden, wurde vom Bundesausschuss
eine Hilfsmittelrichtlinie (2012/2018) beschlossen. Sie dient als Basis für die Verträ-
ge zwischen den Krankenkassen mit den Leistungserbringern. Neben Sehhilfen
beinhaltet sie im Speziellen das Hilfsmittel Hörhilfe. Unter Hilfsmitteln sind
Ä«VlFKOLFKH 0LWWHO RGHU WHFKQLVFKH 3URGXNWH GLH LQGLYLGXHOO JHIHUWLJW RGHU DOV Ve-
rienmäßig hergestellte Ware in unverändertem Zustand oder als Basisprodukt mit
entsprechender handwerklicher Zurichtung, Ergänzung bzw. Abänderung von den
Leistungserbringern DEJHJHEHQ ZHUGHQ³ ]X YHUVWHKHQ ,P (LQ]HOQHQ ZLUG LQ GHU
Richtlinie geregelt, unter welchen Voraussetzungen eine Hörgeräteindikation vor-
liegt und welche Messungen zur Überprüfung der Indikation und des Versorgungs-
ergebnisses durchzuführen sind. Neben der Tonaudiometrie und dem Freiburger
Ein- und Mehrsilbertest in Ruhe, ist auch das Sprachverstehen im Störgeräusch im
freien Schallfeld zu messen. Bei letzterem lässt die Hilfsmittelrichtlinie es offen, ob
der FBE, der OLSA oder der GÖSA herangezogen wird. Weiterhin sind die Art des
Störgeräuschs und die Richtung, aus der es abgespielt wird, nicht näher festgelegt.
Der Schalldruckpegel des Störgeräuschs soll für den FBE bei 60 dB SPL und für
den OLSA und GÖSA bei 45 dB SPL liegen. Während der Gewinn mit Hörgeräten
beim FBE mindestens 10 Prozentpunkte betragen soll (gemessen mit mindestens
zwei Testlisten), wird dieser für die Satztests OLSA und GÖSA belegt, indem bei
einer Sprachverstehensschwelle von 50 % eine Verbesserung des SNR von min-
destens 2 dB vorliegt.

Im Gegensatz zur Hilfsmittelrichtlinie (2012/2018) geht die Norm DIN EN ISO 8253-
3 näher auf Anforderungen bezüglich des Störgeräuschs ein. Für die Auswahl des
=XVDW]VFKDOOV KHL‰W HV GLHVHU Ä«GDUI HLQ IUHTXHQ]EHZHUWHWHV QLFKW PRGXOLHUWHV
Rauschen nach IEC 60645- VHLQ³ 'LHVH ZLHGHUXP EHVFKUHLEW HLQ
Verdeckungsgeräusch, das im Frequenzbereich von 125-1000 Hz konstant ist und
zwischen 1000 Hz und 6000 Hz mit 12 dB pro Oktave abfällt. Weiter besagt die
DIN EN ISO 8253-3, dass die Lautsprecherpositionen für das Störgeräusch sich
symmetrisch bei je 45° befinden sollten. Im Anhang B der Norm finden sich des
Weiteren Beispiele für Messbedingungen mit Zusatzschall, welche auf verschiedene
Störgeräuscharten eingehen. Dabei werden mögliche Rauscharten für modulierte
und nichtmodulierte Geräusche, genauso wie für Stimmengewirr-Geräusche ge-
nannt. Als ein typisches Beispiel für nichtmodulierte Geräusche wird das CCITT-
Rauschen (ITU-T Recommendation G.227) genannt. Im Widerspruch dazu steht
jedoch die Formulierung der DIN 45626-1, die besagt, dass das CCITT-Rauschen
Ä«DOVDGGLWLYHV6W|UJHUlXVFKRGHU]XP9HUGHFNHQXQJHHLJQHW³LVW

    2.4 Sprachmaterial im Vergleich

Nachfolgend werden der FBE, OLSA und GÖSA, sowie der WAKO und der HSM
näher beleuchtet.

Freiburger Einsilbertest (FBE)

Der aus dem Jahr 1953 stammende Sprachtest wurde entwickelt, um vergleichbare
Messungen an verschiedenen Standorten zu ermöglichen (Hahlbrock, 1953): Zum
ersten Mal war es möglich, das Sprachmaterial mittels Schallplatten und Tonbän-

                                                                                   Seite | 7
dern einheitlich zu gestalten. Bis zu diesem Zeitpunkt wurden Sprachtests vorwie-
gend mit ÄOHEHQGHU Sprache³ des jeweiligen Untersuchers durchgeführt. Neben ei-
QHP =DKOHQWHVW ]XU (UPLWWOXQJ GHV Ä+|UYHUOXVWV IU 6SUDFKH³, wurde auch ein
Einsilbertest, der sogenanQWHÄ.QHFKW-7HVW³HQWZLFNHOW0LW8QWHUVWW]XQJYRQ3Ko-
netikern konnte das Testmaterial, nach Zusammenschluss einzelner Laute in Grup-
pen, relativ ausgeglichen erzeugt werden. Dabei ist jedoch zu beachten, dass an-
stelle der eigentlich 51 verschiedenen Laute der deutschen Sprache nur 18 Laut-
klassen (6 Vokale, 2 Diphthonge und 10 Konsonantengruppen) berücksichtigt wur-
den. Um die Testgruppen möglichst äquivalent zu gestalten, wurde auf eine gleich-
mäßige Anzahl von Lauten (73 Laute) pro Testliste geachtet.

Hahlbrock (1953) verwendete als Testmaterial 400 einsilbige Substantive, um eine
mögliche eklektische Kombination gering zu halten. Um Einflüsse wie Bildung oder
Wortschatz von Patienten zu vermeiden, wurden Wörter gewählt, die zum damali-
gen Zeitpunkt als gebräuchlich galten. Jedoch fehlen im Testmaterial bestimmte
Laute und Lautfolgen, die nur in mehrsilbigen Wörtern zu finden sind. Auch das
Verhältnis von Vokalen zu Konsonanten weicht, aufgrund der Beschränkung auf
Einsilber, von dem deutscher Sprache ab. Während es bei fließender Sprache bei
38,7 %:61,3 % liegt, beträgt das Verhältnis des Einsilbertests 29,3 %:70,7 %, was
einer Unterrepräsentation der Vokale entspricht. Durch Messungen mit Normalhö-
renden konnten bereits von Hahlbrock (1953) Referenzkurven ermittelt werden, die
sich über ein Verstehen von 0 bis 100 % erstrecken. Dadurch können verschiedene
Arten von Schwerhörigkeiten (Schallleitungs- und Schallempfindungsschwerhörig-
keiten) aufgrund der veränderten Kurvenverläufe im Vergleich zu dem der Normal-
hörenden unterschieden werden. Während eine Schallleitungsschwerhörigkeit zu
einer Verschiebung der Kurven zu höheren Pegeln mit gleichem Kurvenverlauf führt,
zeigt sich bei einer Schallempfindungsschwerhörigkeit ein abgeflachter Verlauf
(Hahlbrock, 1953). Dadurch kann der Sprachtest auch in der Diagnostik von
Schwerhörigkeiten eingesetzt werden.

Ende der 60er und Anfang der 70er Jahre wurden von der Physikalisch-
Technischen Bundesanstalt (PTB) einige Untersuchungen zum FBE durchgeführt
(Brinkmann et al., 1969a, Brinkmann et al., 1969b, Brinkmann und Diestel, 1970).
Anhand dieser Ergebnisse wurde der FBE schließlich neu aufgenommen (Brink-
mann, 1974): 'HPQDFK ZXUGHQ GLH Ä:|UWHU IU *HK|USUIXQJ PLW 6SUDFKH³ 
nach DIN 45621 in den Studios des Norddeutschen Rundfunks erneuert, nachdem
GLH Ä6WlQGLJH .RPPLVVLRQ IU 6SUDFKDXGLRPHWULH +|UJHUlWH XQG +|UJHUlWHDNXVWi-
ker-)UDJHQ³ HLQHQ HQWVSUHFKHQGHQ %HVFKOXVV KHUYRUJHEUDFKW KDWte. Der Sprecher
der Neuaufnahme war Claus Wunderlich. Die weitere Bearbeitung der Originalauf-
nahme wurde von der PTB und der Deutschen Grammophon Gesellschaft (DGG)
durchgeführt. Im ersten Schritt wurden alle Prüfwörter (100 mehrsilbige und 400
einsilbige) mit einem Impulsschallpegelmesser nach DIN 45633 auf den gleichen
Pegelwert justiert. Im Vergleich zur heute geläufigeren Kalibrierung auf den mittleren
Langzeitpegel (engl.: root mean square, RMS) entsteht dadurch ein Pegelunter-
schied von ca. 6,5 dB (Winkler und Holube, 2016). Zusätzlich wurde der Aufnahme
ein Rauschen (CCITT) sowie drei Kontrolltöne (125 Hz, 1000 Hz und 8000 Hz) an-
gefügt. Diese Signale sollen der Kalibrierung des Gerätes bzw. der einfachen Kon-
trolle des Frequenzgangs des Sprachaudiometers dienen. Durch die DGG wurden
anschließend Pausen zwischen den einzelnen Prüfwörtern eingefügt, die für Zahl-
wörter 5 s und für Einsilber 4 s betrugen.

Brinkmann (1974) beschreibt weiter, dass nach entsprechender Bearbeitung der
Aufnahmen, Bezugskurven für die ein- und mehrsilbigen Wörter gemessen wurden.
Die Messungen wurden an 157 Ohren normalhörender Probanden durchgeführt,
deren Reinton-Hörschwellen aus Voruntersuchungen bekannt waren. Auf jedem als
ÄQRUPDOK|UHQG³ HLQJHVWXIWHP 2KU wurden je vier Zahlwörter- und Einsilbergruppen

                                                                             Seite | 8
dargeboten. Zur Bestimmung der Bezugskurven diente das gemessene Verstehen
als Funktion des verwendeten Schalldruckpegels. Nach Brinkmann (1974) konnte
an die Messergebnisse ein S-förmiger Kurvenverlauf angepasst werden. Außerdem
wurden für jedes geprüfte Ohr diejenigen Impulsschallpegel der Prüfwörter ermittelt,
die zu einem 50 %igen Verstehen führten. Im Mittel betrugen diese für Zahlwörter
18,4 dB (I) und für Einsilber 29,3 dB (I). Als Bezugskurven wurden die Kurvenverläu-
fe eines mittleren Normalhörenden verwendet, anstatt die Kurve der arithmetischen
Mittelwerte vieler Normalhörender heranzuziehen. Weil die Messkurven für einzelne
Normalhörende bei niedrigen bzw. hohen Schalldruckpegeln steiler verlaufen als der
Mittelwert, wurde die Kurve eines mittleren Normalhörenden (Median) für die prakti-
sche Sprachaudiometrie als bedeutender eingestuft.

Aufgrund der Freifeldentzerrung des zur Messung verwendeten Kopfhörers, sind die
Bezugskurven im Prinzip auch für jeden anderen freifeldentzerrten Kopfhörer gültig.
Unter Beachtung des Lautstärkezuwachses beim Übergang von monauralem zu
binauralem Hören, können diese nach entsprechender Verschiebung um ca. 2,5 dB
zu niedrigeren Pegeln auch für das freie Schallfeld mit Lautsprechern angewandt
werden (Brinkmann und Diestel, 1970). Brinkmann (1974) räumt ein, dass der Ver-
lauf der Einsilber-Normalkurve im Sprachaudiogramm von geringem Interesse sei,
da dieser von zahlreichen Parametern, wie zum Beispiel dem Wortschatz und den
kognitiven Fähigkeiten des Probanden, dem Frequenzgang der Wiedergabeappara-
tur sowie von den technischen Eigenschaften der Aufnahme, abhängig ist. Weiter
gesteht er ein, dass die Prüfwörter nicht gleich gut verständlich sind, nur weil ihre
Schallpegel genau gleich justiert sind. Demnach weisen sowohl die Ein- als auch
Mehrsilber erhebliche Unterschiede im Sprachverstehen auf. Als mögliche Gründe
werden neben der Artikulation des Sprechers, auch der spezifische Bekanntheits-
grad eines Wortes sowie dessen Verwechselbarkeit mit ähnlich klingenden Worten
angeführt. Obwohl sich bei der Untersuchung zur Austauschbarkeit der Testgruppen
Unterschiede von bis zu 10 % für Zahlwörter und bis zu 15 % für Einsilber ergeben,
beschreibt Brinkmann   GLHVH DOV QLFKW JUDYLHUHQG XQG IROJHUW GDVV Ä«GLH
Austauschbarkeit der Gruppen für Untersuchungen mit üblicher Genauigkeit ge-
ZlKUOHLVWHW LVW³ $XI *UXQGODJH GHU 8QWHUVXFKXQJHQ Brinkmann et al., 1969a,
Brinkmann et al., 1969b, Brinkmann und Diestel, 1970) und der von Brinkmann
(1974) vorgelegten Zusammenfassung, wurden die Normentwürfe DIN 45621-1 und
DIN 45626-1 vom deutschen Normenausschuss erarbeitet, die die Messungen des
Sprachverstehens in der Praxis standardisiert.

Im Laufe der Zeit hat sich der FBE in der Praxis der Hörgeräteanpassung etabliert.
Die Gründe hierfür liegen wohl in seiner Verfügbarkeit und der Normierung (von
Wedel, 1986). Jedoch beschreiben mittlerweile auch eine Vielzahl von Autoren ein-
schlägige Nachteile des FBE. Dazu gehört beispielsweise die perzeptive Unausge-
wogenheit einzelner Listen, die durch unterschiedliche Bekanntheit einzelner Wör-
ter, Lautheits- und Pegelunterschiede, sowie Phonemunterschiede zwischen den
Testlisten entstehen kann (Baljic, 2016). Aus der Publikation von von Wedel (1986)
geht hervor, dass es unter Einfluss von Störgeräusch zu zusätzlichen Unterschieden
in der Verständlichkeit einzelner Testlisten kommt. Diesen Zusammenhang unter-
suchten auch Winkler et al. (2019a). Dabei ergab sich eine Auffälligkeit der Testlis-
ten 1, 3, 12 und 20 im CCITT-Rauschen, wobei nur Liste 12 auch in Ruhe auffällig
ist. Die Testliste 12 erweist sich auch in der Arbeit von Exter et al. (2016) als auffäl-
lig, bei der die phonetische Ausgewogenheit der Testlisten des FBE untersucht wur-
de. Als Ergebnis wird hier vorgeschlagen, diese Testliste aufgrund ihrer phonemi-
schen und perzeptiven Abweichung auszuschließen. Insgesamt beschreiben Exter
et al. (2016) den FBE in Anbetracht der Möglichkeiten zwar nicht als exakt, aber als
weitgehend phonemisch ausgeglichen. Dies liegt an der Beschränkung auf einsilbi-
ge Nomen, die eine Phonemverteilung wie in fließender Sprache kaum möglich
macht.

                                                                                Seite | 9
Nach von Wedel (1986) spielt auch die mögliche Hemmschwelle der Patienten, be-
stimmte Wörter, wie zum Beispiel Sau, nachzusprechen, eine entscheidende Rolle.
Weiter spricht er die Problematik der fehlenden Objektivität an, welche in der Ab-
hängigkeit der korrekten Aussprache des Patienten und der Hörfähigkeit des Prüfers
begründet ist. Nach Winkler et al. (2019b) ist das Ergebnis zudem von der Worthäu-
figkeit der getesteten Wörter im Alltag und deren Nachbarschaftsdichte abhängig.
Als die lexikalische Nachbarschaft beschreibt Marslem-Wilson (1990) die Anzahl an
Wörtern, die aktiviert werden, wenn ein bestimmtes Wort gehört wird. Nach Winkler
et al. (2019b) ist unter der Nachbarschftsdichte nicht nur die Anzahl lexikalischer
Nachbarn, sondern auch ihr Grad an orthographischer, phonologischer oder seman-
tischer Distanz zum Zielwort zu verstehen.

Für die Messung des FBE im Störgeräusch ermittelten Winkler et al. (2019a) eine
bis dahin noch ausstehende Bezugskurve: Bei der Messung der Schwelle für
50 %iges Verstehen (engl.: Speech Recognition Threshold, SRT50) ergab sich ein
Wert von -1,3 dB SNR bei einer Steigung in diesem Punkt von s50 = 6,5 %-
Punkte/dB. Weil es sich bei dem FBE um einen Worttest handelt, ist der j-Faktor
ähnlich wie bei Satztests, bei denen nur der ganze Satz als richtig oder falsch ge-
wertet wird, mit j = 1 anzunehmen.

Göttinger Satztest (GÖSA)

Die Entwicklung des GÖSA erfolgte durch Kollmeier und Wesselkamp (1997): Sie
haben sich dabei für ein schon vorhandenes Sprachmaterial entschieden, das ur-
sprünglich von der deutschen Telekom zur Qualitätssicherung der Sprachübertra-
gung bei Telefonleitungen verwendet wurde. Das ursprüngliche Inventar bestand
aus insgesamt 400 verschiedenen Sätzen, die von einem ungeschulten männlichen
Sprecher (Hr. Sotscheck) aufgesprochen wurden. Die Satzlängen variieren zwi-
schen drei und sieben Worten. Während 200 dieser Sätze bereits zur Entwicklung
oder Ergänzung des Marburger Satztests verwendet wurden, war die andere Hälfte
des Sprachmaterials noch ungenutzt.

Kollmeier und Wesselkamp (1997) schlossen aus dem Inventar syntaktisch unvoll-
ständige Sätze, solche mit mehrdeutiger Artikulation und Sätze mit nicht akzeptabler
Bedeutung aus dem Sprachmaterial aus. Die übrig gebliebenen 324 Sätze ergaben
Berechnungen zufolge einen RMS-Pegel von -26,5 dB relativ zur Vollausteuerung
(engl.: full scale, FS) mit einer Standardabweichung von 2 dB. Für jeden dieser Sät-
ze wurde eine Diskriminationsfunktion gemessen. Zusätzlich zu dem Sprachmaterial
kann mit der Mess-CD auch ein Rauschen zur Verdeckung der Sprache abgespielt
werden. Zum Ausgleich von Inhomogenitäten einzelner Sätze durch variierende
Verständlichkeit einzelner Worte wurden Gewichtungsfaktoren für Worte eingeführt.
Demnach besitzen leichter verständliche Worte weniger Gewicht als schwerer ver-
ständliche Worte. Jedoch wurde eine Begrenzung des Korrekturwertes eingeführt,
die verhindert, dass das Ergebnis eines einzelnen Wortes das Gesamtergebnis des
Satzes dominiert. Um die Homogenität des Sprachmaterials weiter zu steigern, gli-
chen Kollmeier und Wesselkamp (1997) die RMS-Pegel der einzelnen Sätze anei-
nander an. Nach dieser Pegelkorrektur wurden diejenigen 200 Sätze ausgewählt,
die ein Sprachverstehen zwischen 30 und 70 % aufwiesen. Aus den verbliebenen
200 Sätzen wurden schließlich 20 Testlisten mit je zehn Sätzen zusammengestellt.
Dabei sollten die testlistenspezifischen SRT50-Schwellen und die s50 für alle Listen
gleich sein. Des Weiteren sollte die Anzahl an Worten genauso wie die Anzahl der
Phoneme und deren Häufigkeitsverteilung in jeder Testliste identisch sein. Die resul-
tierenden Listen können Wesselkamp (1994) entnommen werden. Die testlistenab-
hängigen SRT50-Schwellen liegen bei -6,1 dB während die s50 etwa 20 %-Punkte/dB
beträgt. Durch weiterführende Messungen mit Probanden konnten Kollmeier und

                                                                           Seite | 10
Wesselkamp (1997) die Äquivalenz und Reproduzierbarkeit der Testlisten zeigen.
Außerdem wiesen sie einen j-Faktor von 2,38 bei -4 dB SNR und j = 1,95 bei -
8 dB SNR nach. Mit 279 Silben/min (Müller-Deile, 2009), besitzt der GÖSA die
höchste Sprechgeschwindigkeit der hier vorgestellten Sprachtests.

Oldenburger Satztest (OLSA)

Der OLSA stammt aus dem Jahr 1999 und wurde mit dem Ziel eines optimalen
Sprachtests für die deutsche Sprache entwickelt (Wagener et al., 1999a, b, c): Bei
der Erstellung dieses Sprachtests diente der Hagerman-Satztest, welcher für den
schwedischen Sprachraum entwickelt wurde, als Vorbild. Es handelt sich dabei um
einen Matrixtest, dessen Satzbau stets der Form Name ± Verb ± Zahl ± Adjektiv ±
Objekt entspricht. Das Sprachmaterial wurde vom gleichen männlichen Sprecher
(Hr. Sotscheck) wie bei GÖSA und WAKO aufgesprochen. Die Aufnahmen der Sät-
ze wurden geschnitten, sodass anschließend die Einzelwörter zu neuen sinnleeren
Sätzen kombiniert werden konnten. Um die Koartikulationseffekte zwischen gespro-
chenen Wörtern zu berücksichtigen, wurden die Übergänge nach einem
geprochenen Wort zum nächsten beibehalten. Durch die Erhaltung dieser Übergän-
JH NRQQWHQ EHL GHU (U]HXJXQJ GHV 6DW]LQYHQWDUV K|UEDUH Ä%UFKH³ LP 6Dtzfluss
vermieden werden. Aufgrund des fehlenden Sinngehalts sind die Sätze wenig re-
dundant, sodass sie auch mehrmals bei einem Probanden getestet werden können.
Aus den insgesamt 50 verschiedenen Wörtern werden so je nach Länge einer Test-
liste, 20 oder 30 Testsätze generiert. Weil bei Mehrfachmessung immer wieder die
gleichen Wörter in unterschiedlichen Kombinationen vorkommen, kommt es zu ei-
nem Trainingseffekt, der nach Wagener et al. (1999c) nach zwei Übungslisten auf
1 dB begrenzt ist. Die Sprechgeschwindigkeit des OLSA beträgt 233 Silben/min. Für
ein mittleres Sprachverstehen von 50 % ergab sich für Normalhörende im sprachsi-
mulierenden Rauschen ein SNR von -7,1 dB und eine s50 der Diskriminationsfunkti-
on von 17,1 %-Punkte/dB. Das zur Messung verwendete OLnoise wird im nachfol-
genden Kapitel 2.5 näher beschrieben. Der j-Faktor liegt mit j = 4,29 bei einem SNR
von -5 dB und j = 3,18 bei einem SNR von -9 dB höher als bei den anderen Sprach-
tests. Dadurch kann auch die Messgenauigkeit als höher angenommen werden.

Reimtest nach von Wallenberg und Kollmeier (WAKO)

Der WAKO basiert auf dem von Sotscheck im Jahr 1982 entwickeltem Reimtest
deutscher Sprache, welcher ursprünglich für die Nachrichtentechnik vorgesehen war
(von Wallenberg und Kollmeier, 1989 aus Sotscheck, 1982). Dieser wies gegenüber
anderen Sprachtests einige Vorteile auf, die von Wallenberg und Kollmeier für die
klinische Audiologie ausnutzen wollten. In der ersten Version von Sotscheck wurde
dem Probanden ein einsilbiges Wort der Form Konsonant ± Vokal - Konsonant vor-
gespielt und zeitgleich sechs Antwortalternativen vorgegeben, die sich nur geringfü-
gig in An-, In- oder Auslaut vom gesprochenen Wort unterscheiden. Weil es sich bei
dem Worttest um einen geschlossenen Test handelt, ist dieser auch bei Personen
mit einer anderen Muttersprache als Deutsch durchführbar. Des Weiteren ist der
Sprachtest damit automatisierbar und weitgehend unabhängig vom Versuchsleiter.
Zudem repräsentieren die von Sotscheck (1982) erstellten Testlisten die
Phonemverteilung der deutschen Sprache und ergeben bei der Messung mit Nor-
malhörenden das gleiche prozentuale Verstehen.

Wegen dieser Vorteile wählten von Wallenberg und Kollmeier (1989) das vorhande-
ne Sprachmaterial aus und modifizierten es für die klinische Audiologie. Weil die
Messzeit mit Testlisten von je 100 Wörtern zu lange dauern würde, wurde eine Kür-
zung vorgenommen. Des Weiteren wurden Antwortalternativen ausgeschlossen, die
sich in mehr als nur einem Phonem unterschieden, um eine detaillierte Analyse der
auftretenden Verwechslungen durchführen zu können. Im Alltag ungebräuchliche
Worte wurden zudem weitgehend eliminiert.
                                                                            Seite | 11
Zur Modifikation der Testlisten wurden zuerst alle Zielwörter mit Diphthongen und
Konsonantenclustern sowie ungebräuchliche Einsilber aus dem Testinventar gestri-
chen. Auf diese Weise verblieben insgesamt 72 Testwörter mit je vier Antwortalter-
nativen. Diese verteilen sich folgendermaßen über die veränderlichen Wortteile: 33
im Anlautteil, 25 im Inlautteil und 14 im Auslautteil. Nach von Wallenberg und
Kollmeier (1989) entspricht die Häufigkeit der insgesamt verfügbaren Zielphoneme
dabei ungefähr der Phonemhäufigkeit der deutschen Sprache. Die verbleibenden
Testitems wurden schließlich in vier Testlisten mit exakt gleicher Häufigkeitsvertei-
lung der Zielphoneme aufgeteilt, welche zudem der deutschen Sprachstatistik in der
Reihenfolge der Phonem-Häufigkeit folgen (von Wallenberg und Kollmeier, 1989
aus Meier, 1967).

Zur weiteren Analyse der auftretenden Phonemverwechslungen, war es erstre-
benswert, die Testlisten auch in Bezug auf Verwechslungsmatrizen äquivalent zu
gestalten. Diese zeigen für Konsonanten und Vokale die Häufigkeit der korrekten
Erkennung gegenüber der Häufigkeit der Verwechslung mit anderen Konsonanten
und Vokalen. Nach von Wallenberg und Kollmeier (1989) ist mit den Messdaten des
WAKO und den von ihnen erstellten Verwechslungsmatrizen eine Einschätzung von
Störungen der akustischen Übertragungsstrecke bzw. der peripheren Verarbeitung
akustischer Informationen möglich. Des Weiteren gehen sie davon aus, dass durch
die Messung des WAKO indirekt auf Kenndaten des Gehörs geschlossen werden
kann, die sonst nur mit psychoakustischen Tests zugänglich sind.

Aufbauend auf den von von Wallenberg und Kollmeier (1989) erstellten Testlisten
nahmen Brand und Wagener (2005) weitere Modifikationen vor: So erstellten sie
zusätzlich zu den Testlisten mit je 72 Worten verkürzte Versionen, in denen jede
Testliste nur noch 47 bzw. 25 Worte besitzt. Auf diese Weise ist eine kürzere Mess-
dauer möglich, wodurch sich die Anwendbarkeit des Testmaterials vor allem im kli-
nischen Alltag erhöht. Jedoch ist zu beachten, dass mit kürzer werdenden Testlisten
die Standardabweichungen der ermittelten Schwelle und dazugehörigen Steigung
ansteigen (Brand und Wagener, 2005). Die verkürzten Testversionen wurden ho-
mogen und mit einer Phonemverteilung, die weitgehend der von deutscher Sprache
entspricht, erstellt. Durch Messungen mit normalhörenden Probanden konnte au-
ßerdem gezeigt werden, dass das Sprachmaterial auch zu Messungen des Sprach-
verstehens in Ruhe geeignet ist. Die Test-Retest-Messungen des modifizierten
Testinventars ergaben genauere Ergebnisse, als solche, die mit dem Freiburger
Sprachtest ermittelt werden können. Jedoch entspricht der j-Faktor des WAKO mit
j = 1 dem des FBE, da auch hier nur ein Wort pro Trial gemessen wird.

Insgesamt lässt sich festhalten, dass der WAKO in seiner modifizierten Version viele
Vorteile gegenüber anderen Sprachtests wie dem FBE bietet. Dazu gehört bei-
spielsweise auch die Anwendbarkeit im Störgeräusch. Als Maskierer wird das GÖ-
noise verwendet, das ursprünglich aus dem Sprachmaterial des WAKO generiert
wurde und auch als Maskierer für den GÖSA dient. Trotz seiner Vorteile konnte sich
der WAKO in der Praxis noch nicht durchsetzen. So ist er beispielsweise nicht in der
Hilfsmittelrichtlinie zur Hörgeräteversorgung als mögliches Testverfahren genannt.

Hochmair-Schulz-Moser-Satztest (HSM)

Zum ersten Mal wird der HSM von Schmidt et al. (1997) erwähnt: Darin heißt es,
dass dieser entwickelt wurde, um das Satzverstehen von CI-Patienten wiederholt
messen zu können. Hierfür ist eine ausreichende Anzahl an Testlisten notwendig.
Die Abkürzung HSM steht dabei für die Entwickler des Sprachtests Hochmair-
Desoyer, Schulz und Moser. Bei der Erstellung des Tests wurde darauf geachtet,
dass nur Worte verwendet werden, die in allen Teilen Deutschlands gleichermaßen

                                                                           Seite | 12
Sie können auch lesen