Percepcja dźwięku w naturalnych warunkach dźwiękowych

Modelowanie percepcji mowy w niekorzystnych warunkach akustycznych

Zrozumiałość mowy zazwyczaj określana jest na podstawie badania, w którym wyznacza się procent poprawnie zrozumianych jednostek lingwistycznych, prezentowanych uprzednio słuchaczom. Jeśli interesuje nas zrozumiałość mowy np. dla osób z ubytkiem słuchu, pomiary należy wykonać dla słuchaczy z niedosłuchem. Niestety, tego typu badania są zwykle dość złożone, czasochłonne oraz kosztowne. Z tego powodu często stosuje się procedury, które umożliwiają predykcję zrozumiałości mowy w danym otoczeniu dźwiękowym. Najpowszechniej stosowanymi wskaźnikami tego typu są: AI (ang. Articulation Index), SII (ang. Speech Intelligibility Index) oraz STI (ag. Speech Transmission Index).

Pomimo pewnych różnić w otrzymywanych rezultatach, wynikających z różnic pomiędzy samymi algorytmami, STI oraz SII mają wiele cech wspólnych. Modele te zakładają, że ogólna informacja niesiona przez sygnał mowy może być przedstawiona jako pewna suma informacji zakodowanych w różnych kanałach częstotliwości. Modelowanie uwzględnia właściwości peryferyjnego układu słuchowego oraz dane opisujące „wkład” poszczególnych pasm częstotliwościowych w ostateczną zrozumiałość mowy. W wyniku obliczeń otrzymuje się wartość zawierającą się w przedziale od 0 do 1, która ilościowo opisuje przewidywaną zrozumiałość mowy.

Standardowe procedury STI i SII są modelami monauralnymi, tzn. nie uwzględniają interakcji informacji z obu uszu. Z drugiej strony, liczne wyniki badań wyraźnie wykazują, że binauralna percepcja mowy różni się znacząco od słyszenia jednousznego, co szczególnie widoczne jest w przypadku porównania zrozumiałości mowy prezentowanej monauralnie oraz binauralnie w przypadku tzw. efektu cocktail party. Jednakże, należy pamiętać, że w/w „binauralny zysk” zrozumiałości jest mniejszy w przypadku osób z patologią słuchu, niż słuchaczy otologicznie normalnych. Sytuacja ta jeszcze bardziej komplikuje się, jeżeli wielkość ubytku słuchu w obu uszach jest niejednakowa (asymetryczne uszkodzenie słuchu).

Przeprowadzone dotąd badania wykazują, że modele dwuuszne są o wiele bardziej przydatne do przewidywania zrozumiałości mowy osób normalnie słyszących oraz niedosłyszących, niż modele monauralne. Należy jednak pamiętać, że w tych doświadczeniach zastosowano symulacje warunków maskowania, w związku z tym planuje się przeprowadzenie analogicznych badań, ale dla rzeczywistych warunków akustycznych. Ostatecznie, dane te umożliwią opracowanie ostatecznych modeli, umożliwiających precyzyjną predykcję zrozumiałości mowy osób z uszkodzeniem słuchu.

AVE – wirtualny symulator percepcji dźwięku umożliwiający wykonanie samodzielnego badania skryningowego

Symulator AVE (Auditory Virtual Environment ) jest systemem służącym do symulacji różnych warunków akustycznych. Umożliwia on np. demonstracje oraz analizę procesu komunikatywnego w określonych, symulowanych warunkach. Ponieważ konwersacja w niekorzystnym otoczeniu dźwiękowym jest szczególnym problemem dla osób niedosłyszących, system AVE może być wykorzystany do samodzielnego badania skryningowego. Problemy ze słyszeniem określonych dźwięków oraz ze zrozumieniem współmówcy pojawiają się zazwyczaj, kiedy w tym samym momencie mówi kilka osób (np. kawiarnia, przyjęcie), mowa jest zagłuszana przez dość głośne dźwięku (np. hałas uliczny) lub w pomieszczeniach o dużym czasie pogłosu (np. dworce, kościoły).

Jednym z naszych celów jest opracowanie testów skryningowych, które mogą być wykonane samodzielnie przez osobę badaną za pomocą Internetu. Celem tego typu badania jest wykazanie potencjalnych problemów ze zrozumiałością mowy w w/w warunkach akustycznych oraz wstępne zdiagnozowanie stanu słuchu. W razie podejrzenia ubytku słuchu, system sugeruje osobie badanej wizytę w wyspecjalizowanej placówce oraz przeprowadzenie bardziej zaawansowanych badań słuchu.