Widex hat Hörsysteme schon immer so konzipiert, dass sie ihren Trägern den natürlichsten Klang bieten. Dazu gehören die Gewährleistung eines unverzerrten Eingangssignals selbst bei hohen Pegeln (Oeding & Valente, 2015), die Bereitstellung einer ausreichenden Verstärkung über einen erweiterten Frequenzbereich (Peeters et al., 2011) und die Bewahrung der natürlichen zeitlichen Eigenschaften des Schalls durch die Verwendung einer langsam wirkenden Kompression (Kuk, 1998). Die Signalverarbeitung PureSound der Widex MOMENTPlattform nutzt die ZeroDelay-Technologie, um die Vollständigkeit der Eingangssignale bei Anpassungen mit Zusatzbelüftung (insbesondere offenen Versorgungen) weiter zu bewahren. Dies wird erreicht, indem die Durchlaufverzögerung des Hörsystems auf weniger als 0,5 ms über alle Frequenzen hinweg verkürzt wird.
Die ultraschnelle Signalverarbeitung von PureSound fördert die Synchronität zwischen dem vom Hörsystem verstärkten Schall und dem unverstärkten Direktschall, der den Gehörgang über das Vent der akustischen Ankopplung erreicht. Das Ergebnis ist ein Signal, das praktisch frei von Kammfiltereffekten ist (Balling et al., 2020). Diese Artefakte des Kammfiltereffektes würden dem Schall “metallische” oder “dumpfe” Klangcharakteristiken verleihen (Bramslow, 2010). In der Tat haben bisherige Studien gezeigt, dass die PureSound-Verarbeitung die Klangqualität und die Wahrnehmung der eigenen Stimme bei Hörsystem-Trägern mit offener Anpassung verbessert (Balling et al., 2020), ohne dabei die Sprachverständlichkeit bei realistischen SNRs zu beeinträchtigen (Kuk et al., 2020, siehe auch Teil 1 der Reihe, Hörakustik 12/2020).
Das Verwirklichen einer besseren Synchronität zwischen verstärktem und Direktschall bewahrt auch die natürliche Einhüllende eines Klangs. Dies ist wichtig, da Studien darauf hindeuten, dass sich Menschen für ein robustes Sprachverstehen sowohl unter ruhigen als auch unter störgeräuschbehafteten Bedingungen auf die Informationen der Signal-Einhüllenden verlassen (Swaminathan, 2012). Im Gehirn wird die Information der Einhüllenden durch eine Informationsrate repräsentiert, bei dem die Neuronenpopulation synchrone Aktionspotenziale auf periodische Modulationen der Einhüllenden produziert. Die vom Hörnerv ausgehende Informationsrate wird die Hörbahn hinaufgeleitet, wo sie durch komplexere Hörprozesse verarbeitet und transformiert wird. Die synchrone Aktivität der auditiven Neuronen kann bei den jeweiligen Hörern mittels Elektroenzephalografie (EEG) aufgezeichnet werden. Solche EEG-Signale werden allgemein als Frequency- Following-Responses (FFRs, für eine Übersicht siehe Skoe und Kraus, 2010) oder Envelope-Following-Responses (EFRs) bezeichnet, wenn die neuronale Aktivität in Abhängigkeit der temporalen Einhüllenden betrachtet wird (Aiken & Picton, 2008).
Üblicherweise wird in EFR-Experimenten gemessen, wie gut auditorische Neuronen die Grundfrequenz (f0) von Sprachlauten (z. B. Vokalen) codieren. Da die Obertöne eines Vokals alle durch die Glottal-Frequenz (f0) amplitudenmoduliert werden, bietet die Verwendung synthetischer Sprache eine Betrachtungsmöglichkeit dafür, wie gut die Einhüllende der Amplitude über die Frequenzen hinweg nachverfolgt wird. Die Literatur deutet darauf hin, dass robustere EFRs mit besseren Sprache-im-Störgeräusch-Fähigkeiten (Song et al., 2011) und Unterschieden auf Gruppenebene bei den auditiven Verarbeitungsfähigkeiten in Verbindung gebracht werden. Dies hat sich bei Untersuchungen der Musikalität (Musacchia et al., 2008) oder der tonalen Spracherfahrung (Krishnan et al., 2005) abgezeichnet. Umgekehrt zeigte sich, dass durch Sprachsignale evozierte EFRs in Gegenwart von Hintergrundgeräuschen eine Verschlechterung aufweisen (Li & Jeng, 2011).
In der aktuellen Studie wird untersucht, wie sich die ZeroDelay-Technologie auf die Fähigkeit des zentralen auditorischen Systems auswirkt. Präzise gesagt auf die Codierung temporaler Einhüllender des Eingangssignals. Diese Ergebnisse könnten wichtige Informationen darüber liefern, wie die Verarbeitungsverzögerung in Hörsystemen diese Hüllkurve auf neuronaler Ebene möglicherweise verzerrt. Das ist wichtig, da die Informationen aus der temporalen Einhüllenden in höheren Ebenen der auditiven Verarbeitung benötigt werden.
Wir vermuten, dass die Interaktion zwischen Direktschall und verstärktem Schall bei einer offenen Anpassung Interferenzen erzeugt, die die Einhüllende (d. h. f0) der synthetisch produzierten Silbe /da/ auf Ebene der EFRs verzerrt. Darüber hinaus sollte die Verzerrung der zeitlichen Einhüllenden bei offen angepassten Hörsystemen mit längeren Durchlaufverzögerungen größer sein. Aus diesem Grund haben wir die mit dem Widex PureSound gemessenen EFRs mit den Premium-Hörsystemen zweier namhafter Hersteller mit längeren Verzögerungszeiten verglichen (Balling et al., 2020). Wir erwarten, dass die Hörsysteme, deren Durchlaufzeiten im Vergleich zur PureSound-Signalverarbeitung länger sind, weniger robuste EFRs hervorbringen werden.
Methoden der Studie:
Teilnehmer: Insgesamt nahmen 16 ältere Probanden mit vorliegenden Hörminderungen an der Studie teil. Die Studienteilnehmer waren zwischen 58 und 81 Jahren alt. Ihr Durchschnittsalter betrug 69,8 Jahre. Zehn Probanden waren zum Zeitpunkt der Studie bereits erfahrene Hörgeräte-Träger mit Trageerfahrungen von 1 bis 15 Jahren. Ein Proband hat bereits früher an Hörgeräte-Studien teilgenommen, war aber zum Zeitpunkt der Studie kein Hörgeräte-Träger. Fünf weitere Teilnehmer hatten noch nie Hörgeräte getragen. Alle Probanden hatten einen beidseitig symmetrischen (innerhalb von 10 dB) geringen bis mittelgradigen sensorineuralen Hörverlust (siehe Abbildung 1). Zusätzlich bestanden alle Probanden ein kognitives Screening unter Verwendung des Montreal Cognitive Assessment (MoCA Durchschnittspunktzahl = 26,2). Das Testverfahren wurde von einem Ethikkomitee eines externen Gremiums genehmigt. Zusätzlich wurde von allen Teilnehmern eine Einverständniserklärung eingeholt.
Hörgeräte: Das Widex MOMENT-Hörsystem wurde unter der Verwendung der PureSound-Signalverarbeitung mit den Premium-Produkten zweier anderer Hersteller verglichen. Die Systeme wurden nach NAL-NL2- Vorberechnungen und mittels Standardeinstellungen des Feature-Settings bei Verwendung offener Schirmchen angepasst. Alle drei Hörgeräte verfügten über erstklassige Feature-Ausstattungen, die von Premium-Produkten erwartet werden. Dies beinhaltet z. B. adaptive Richtmikrofone, eine Störgeräuschunterdrückung sowie ein Rückkopplungsmanagement mit der Ausnahme, dass die PureSound-Signalverarbeitung ein omnidirektionales Mikrofon verwendet. Akustische Messungen ergaben für PureSound eine Durchlaufverzögerung von 0,5 ms über alle Frequenzen hinweg, während eine Verzögerung von 6 ms bzw. 8 ms für Hersteller 1 und Hersteller 2 festgestellt wurde.
Elektroenzephalografie (EEG): Die Tests fanden in einer schallisolierten Kabine statt. Eine Klatt-synthetisierte / da/-Silbe (Dauer = 50 ms) wurde bei 70 dB SPL in alternierenden Polaritäten über 8.000 Darbietungen (4.000 pro Polarität) hinweg präsentiert. Die Stimuli wurden im Freifeld über einen Aktivlautsprecher abgespielt. Der Lautsprecher befand sich in einem Meter Entfernung direkt vor den Studienteilnehmern.
Die EEG-Aufzeichnung der Probanden wurde anhand einer vertikalen Ableitung durchgeführt, wobei eine aktive Elektrode am Vertex (Cz) und am Ohrläppchen verwendet wurde. Als Masse diente eine Elektrode oben an der Stirn. Die Elektrodenimpedanz blieb unter 35 kΩs, während die Elektrodenaktivität mit einem g.tec g.USBamp (Guger Technologies, GmbH) Biosignalverstärker mit einer Abtastrate von 19,2 kHz erfasst wurde.
Analyse: Fortlaufende EEG-Daten wurden zunächst zwischen 80 Hz und 2.000 Hz gefiltert und dann von –10 bis 80 ms relativ zum Reizbeginn “epochiert” (geschnitten). Epochen wurden verworfen, wenn sie Aktivitäten von ±35 μV überschritten. Etwa 7.400 Untersuchungen (3.700 pro Polarität) überstanden dieses Verfahren und wurden dann im Zeitbereich für jede Kombination aus Probanden und Testbedingung (Hörsystem) gemittelt.
Ergebnisse
Abbildung 2 vergleicht die über Hörsystemen gemessenen EFRs im Zeitbereich mit dem synthetisch generierten Sprachsignal – der Silbe /da/. Die zeitliche Einhüllende der Amplitude der /da/-Silbe (Originalsignal) wird durch die rote Linie im oberen Feld gekennzeichnet. Man kann erkennen, dass die durchschnittlichen EFRs (dargestellt durch die farbigen Linien in den unteren Feldern) der Einhüllenden des /da/-Stimulus am ähnlichsten waren, wenn das Widex MOMENT-Hörsystem mit PureSound getragen wurde (blaue Linie). Umgekehrt waren EFRs unter Verwendung der Premium-Hörsysteme der beiden anderen Hersteller verzerrt.
Der Vorteil der PureSound-Verarbeitung ist, wie in Abbildung 3 dargestellt, auch im Zeit-Frequenz-Bereich sichtbar. Hierbei wurden gemittelte Daten des Zeitbereichs durch kontinuierliche Wavelet-Transformationen unter Verwendung analytischer (komplexer) Morse-Wavelets zerlegt. Die resultierenden Abbildungen zeigen die Stärke der EFRs bei jeder Frequenz über die Dauer des /da/-Stimulus. Hellere Farben spiegeln eine robustere Codierung der zeitlichen Einhüllenden wider. Der Vergleich der drei Hörgeräte zeigt, dass die Bedingung unter der Verwendung von PureSound die höchste Konzentration von “Gelb” und “Hellblau” um 100 Hz aufweist. Dies deutet darauf hin, dass PureSound die größte anhaltende Energie entsprechend der Grundfrequenz der /da/- Silbe (f0) aufrechterhalten hat, gefolgt von Hersteller 2 und dann Hersteller 1.
Zusammengefasst deuten diese Ergebnisse darauf hin, dass die bei manchen Premium-Hörgeräten längeren Verarbeitungszeiten die neuronale Verfolgung der zeitlichen Signal-Einhüllenden verzerren, wenn deren Anpassung mit einem offenen Schirmchen erfolgt.
Diskussion
In offenen Anpassungen stellten wir fest, dass die ZeroDelay-Technologie, die in der PureSound- Signalverarbeitung des Widex MOMENT-Hörsystems enthalten ist, eine robuste neuronale Verfolgung der Spracheinhüllenden begünstigt. Umgekehrt stellte sich heraus, dass hochwertige Geräte der aktuellen Generation von zwei anderen Herstellern, die über längere Durchlaufzeiten verfügen, die neuronale Verfolgung der Einhüllenden stark verzerren. Dieses Ergebnis baut auf den von Balling et al. (2020) vorgestellten Klangqualitätspräferenzen für die PureSound-Verarbeitung auf. Außerdem legen unsere Ergebnisse den Bedarf nahe, die akzeptierbaren Kriterien für tolerierbare Verzögerungen in offen angepassten Hörsystemen zu überdenken (siehe z. B. Stone et al., 2008).
Die langfristigen Auswirkungen einer verzerrten zeitlichen Codierung der Einhüllenden, insbesondere unter schwierigeren Hörbedingungen, sind derzeit unbekannt. Gemäß dem von Pichora-Fuller et al. (2016) vorgeschlagenen “Framework for Understanding Effortful Listening” (FUEL) kann erfolgreiches Sprachverstehen eine größere kognitive Leistung (d. h. Anstrengung) erfordern, wenn die Qualität des zur Verfügung stehenden Signals für den Zuhörer suboptimal ist. Es wird angenommen, dass die Grundfrequenz (f0) eines Zielsprechers einen wichtigen Anhaltspunkt liefert für die Extraktion der Zielstimme aus konkurrierenden irrelevanten auditorischen Informationen, wie z. B. anderen Sprechern (Summers & Leek, 1998) oder Umgebungsgeräuschen.
Insbesondere f0-Hüllkurven erleichtern wahrscheinlich Prozesse im Zusammenhang mit der Analyse auditiver Szenen (Bregman, 1990), indem sie Sprachenergie über Frequenzen und die Zeit hinweg miteinander verknüpfen. Dies unterstützt die Stimmlagen- (Oxenham, 2012) und Sprecheridentifikation (Baumann & Bein, 2010). Die neuronale Codierung von f0 (d. h. die EFR) scheint zumindest bei Normalhörenden die Wahrnehmung der Tonhöhe zuverlässig widerzuspiegeln (Coffey et al., 2016) und die Sprache-im-Störgeräusch-Fähigkeiten vorherzusagen (Song et al., 2011). Wenn diese Informationen ständig verzerrt sind, kann es sein, dass alltägliche Höraktivitäten mehr Mühe erfordern, als die Zuhörer aufwenden können oder wollen. Im Laufe der Zeit kann dies zu chronischem Stress, Müdigkeit und sozialem Rückzug führen. All diese Aspekte haben eine negative Auswirkung auf die Kognition und die Lebensqualität (Pichora-Fuller, 2015).
Swaminathan und Heinz (2012) stellen fest, dass Sprache-im-Störgeräusch-Defizite bei Menschen mit sensorineuraler Hörminderung teilweise auf die Informationsverluste der zeitlichen Einhüllenden zurückzuführen sind, diese Inhalte werden normalerweise über die zeitliche Feinstruktur gewonnen. Vergleichbar ist dies mit der EFR-Codierung der Amplitudenmodulation, die über die Oberwellen entlang des Sprachsignals erlangt wird.
In der Tat wäre zu erwarten, dass durch die umfassend dokumentierte Verbreiterung des cochleären Tunings solche Ergebnisse den Eigenschaften eines sensorineuralen Hörverlusts folgen (Liberman & Dodds, 1984).
Sowohl perzeptuelle als auch neurophysiologische Studien legen jedoch nahe, dass die neuronale Codierung der temporalen Einhüllenden von Sprache nach einer sensorineuralen Hörminderung nicht beeinträchtigt ist, zumindest nicht unter ruhigen Hörbedingungen (Lorenzi et al., 2006; Kale & Heinz, 2010). Bestrebungen, um diese Erkenntnisse zu erklären, zeigten eine Form der kompensatorischen Plastizität auf Ebene des Hirnstamms oder des Mittelhirns, die die Codierung der Einhüllenden in ruhigen Situationen wiederherstellt, jedoch bei komplexen Hörbedingungen oder bei reduzierten Informationen durch die Einhüllende scheitert (für eine Übersicht siehe Parthasarathy et al., 2019). Sollte dies zutreffen, ist es für Hörsystem-Strategien vielversprechend, wenn sie die neuronale Verfolgung der Einhüllenden fördern, indem sie die Hüllkurve des Eingangssignals durch Technologien wie langsamere Kompressionsgeschwindigkeiten und, wie hier gezeigt, ultraschnelle Verarbeitungsverzögerungen bei offenen Anpassungen besser erhalten.
Es sollte auch bedacht werden, dass der in dieser Studie berichtete Effekt zum Teil den starken Präferenzen der Hörer für die PureSound-Signalverarbeitung aufgrund der Klangqualität und der Beurteilung der eigenen Stimme zugrunde liegen könnte (Balling et al., 2020). Dies sind wichtige Beobachtungen, die dazu beitragen können, einen reibungslosen Übergang zu einer auditiven Wahrnehmung mittels Hörsystemen sicherzustellen.
Dementsprechend wäre mit PureSound eine häufigere Verwendung von Hörgeräten und eine höhere Zufriedenheit von Erstanwendern gewährleistet. Die Förderung der frühzeitigen Hörgeräte-Akzeptanz bei Menschen mit leichtem bis mittelgradigem Hörverlust ist für Hörakustiker eine Herausforderung. Viele der angehenden Hörsystem-Träger empfinden durch ihre Hörminderung anfänglich nur eine begrenzte Belastung, sodass Okklusion und Komfort der Hörsysteme oft den Vorteil der verbesserten Hörbarkeit überwiegen (Kochkin, 2012). Offene Anpassungen ermöglichen ihren Trägern eine größere akustische Transparenz, indem sie Okklusions-Effekte reduzieren und zu einer größeren Geräte-Zufriedenheit führen (Gnewikow, 2006).
Die ZeroDelay-Technologie trägt zu diesem Vorteil bei und gestaltet die Erstanpassung noch transparenter.
Es gibt nun mehrere Indizien dafür, dass die ZeroDelay-Technologie der PureSound-Signalverarbeitung die Transparenz offen angepasster Hörsysteme weiter verbessert. Dies geschieht, indem durch PureSound spektrale und zeitliche Verzerrungen entfernt werden, die in bisherigen digitalen Hörsystemen mit einer verlängerten Durchlaufzeit in Verbindung gebracht werden. Obwohl diese Studie auf Basis offener Anpassungen durchgeführt wurde, gelten die Beobachtungen voraussichtlich auch für weitere Vent-Anpassungen. Denn in allen Anpassungen, die eine akustische Leckage zulassen, kann der Kammfiltereffekt durch Verzögerungen der Verarbeitungsgeschwindigkeit auftreten. Dies bedeutet, dass die PureSound-Signalverarbeitung potenziell einer Mehrheit an Hörsystem-Trägern zugutekommen kann – und nicht nur denjenigen mit einer leichten Hörminderung. Diese Eigenschaften können die Akzeptanz von Hörsystemen sowie die dazugehörige Zufriedenheit fördern, denn sie unterstützen die Betroffenen, zu einer natürlichen Klangwelt zurückzukehren.
Dieser Artikel erschien ursprünglich in englischer Sprache in der August-Ausgabe2020 von “The Hearing Review” (www.Hearing Review.com): https://www.hearingreview.com/… facilitated-by-widex-zerodelay-technology
Die deutsche Version des Artikels erschien ursprünglich in der Ausgabe 1/2021 in der “Hörakustik”.
Quellen:
Aiken S J, Picton T W (2008). Envelope and spectral frequency-following responses to vowel sounds.
Hear Res. 2008; 245 (1-2):35-47.
Balling L W, Townend O, Stiefenhofer G, Switalski W. (2020). Reduced hearing aid delay for optimal sound quality: A new paradigm in processing. Hearing Review. 2020; 27 (4):20-26.
Baumann O, Belin P. (2010). Perceptual scaling of voice identity: Common dimensions for different vowels and speakers. Psychol Res. 2010; 74 (110).
Bramslow L. (2010). Preferred signal path delay and high-pass cut-off in open fittings. Int J Audiol.2010; 49 (9): 634-644.
Bregman A S. (1990). Auditory scene analysis: The perceptual organization of sound. Bradford Books, MIT Press; 1990.
Coffey E B J, Colagrosso E M G, Lehmann A, Schönwiesner M, Zatorre R J. (2016). Individual differences in the frequency-following response: Relation to pitch perception. PLoS ONE.2016:1-27.
Gnewikow D, Moss M. (2006). Hearing aid outcomes with open- and closed-canal fittings. Hear Jour. 2006; 59 (11): 66-72.
Kale S, Heinz M G. (2010). Envelope coding in auditory nerve fibers following noise-induced hearing loss. J Assoc Res Otolaryngol. 2010; 11: 657-673.
Kochkin S. (2012). MarkeTrak VIII: The key influencing factors in hearing aid purchase intent. Hearing Review. 2012; 19 (3): 12-25.
Krishnan A, Xu Y, Gandour J, Cariani P. (2005). Encoding of pitch in the human brainstem is sensitive to language experience. Cogn Brain Res. 2005; 25 (1): 161-168.
Kuk F. (1998). Rationale and requirements for a slow acting compression hearing aid. Hear Jour. 1998; 51 (6): 45–79.
Kuk F, Ruperto N, Slugocki C, Korhonen P. (2020). Efficacy of directional microphones in open-fitting under realistic signal-to-noise ratios. Hearing Review. 2020; 27 (6): 20-23.
Li X, Jeng F C. (2011). Noise tolerance in human frequency-following responses to voice pitch. J Acoust Soc Am. 2011; 129 (1): EL21.
Liberman M C, Dodds L W. (1984). Single-neuron labeling and chronic cochlear pathology. III. Stereocilia damage and alterations of threshold tuning curves. Hear Res. 1984; 16 (1): 55-74.
Lorenzi C, Gilbert G, Carn H, Garnier S, Moore B C J. (2006). Speech perception problems of the hearing impaired reflect inability to use temporal fine structure. Proc Natl Acad Sci USA. 2006; 103 (49): 18866-18869.
Musacchia G, Strait D, Kraus N. (2008). Relationships between behavior, brainstem and cortical encoding of seen and heard speech in musicians and non-musicians. Hear Res. 2008; 241 (1-2): 34-42.
Oeding K, Valente M. (2015). The effect of a high upper input limiting level on word recognition in noise, sound quality preferences, and subjective ratings of real-world performance. J Am Acad Audiol. 2015; 26 (6): 547-562.
Oxenham A J. (2012). Pitch perception. J Neurosci. 2012; 32 (39): 13335-13338. Parthasarathy A, Bartlett E L, Kujawa S G. (2019). Age-related changes in neural coding of envelope cues:
Peripheral declines and central compensation. Neurosci. 2019; 407 (21): 21-31.
Peeters H, Lau C, Kuk F. (2011). Speech-in-noise potential of hearing aids with extended bandwidth. Hearing Review. 2011; 18 (3): 28–36.
Pichora-Fuller M, Mick P T, Reed M. (2015). Hearing, cognition, and healthy aging: Social and public health implications of the links between age-related declines in hearing and cognition. Semin Hear. 2015; 36 (3): 122-139.
Pichora-Fuller M K, Kramer S E, Eckert M A et al. (2016). Hearing impairment and cognitive energy:
The framework for understanding effortful listening (FUEL). Ear Hear. 2016; 37: 5S-27S.
Skoe E, Kraus N. (2010). Auditory brainstem response to complex sounds: A tutorial.Ear Hear. 2010; 31 (3): 302-324.
Song J H, Skoe E, Banai K, Kraus N. (2011). Perception of speech in noise: Neural correlates. J Cogn Neurosci.2011; 23 (9) : 2268-2279.
Stone M A, Moore B C J, Meisenbacher K, Derleth R P. (2008). Tolerable hearing aid delays. V. Estimation of limits for open canal fittings. Ear Hear. 2008; 29 (4): 601-617.
Summers V, Leek M R. (1998). F0 processing and the separation of competing speech signals by listeners with normal hearing and with hearing loss. J Speech Lang Hear Res.1998; 41 (6): 1294-1306.
Swaminathan J, Heinz M G. (2012). Psychophysiological analyses demonstrate the importance of neural envelope coding for speech perception in noise. J Neurosci. 2012; 32 (5): 1747-1756.
Widex Hörgeräte GmbH
Epplestraße 225
70567 Stuttgart
Telefon: +49 (711) 7895-0
Telefax: +49 (711) 7895-200
http://www.widex-hoergeraete.de
Content Managerin
Telefon: 0711/7895-152
E-Mail: peggy.reiss@widexsound.com