------------
Spis treści
1. Wprowadzenie
2. Podstawy teoretyczne
2.1 Percepcja sygnału mowy w warunkach pogłosowych
2.2 Efekt "cocktail party"
2.3 Aktywność korowa podczas celowanego słuchania mowy oraz detekcja uwagi słuchowej (AAD) wraz z jej matematycznymi podstawami
3. Cel badań
4. Eksperyment
4.1 Grupa badawcza
4.2 Aparatura
4.3 Przygotowania wstępne oraz ogólny przebieg eksperymentu
4.4 Sygnały oraz sceneria eksperymentalna
5. Analiza wyników
6. Dyskusja i podsumowanie
BIBLIOGRAFIA
ZAŁĄCZNIKI
--------------------
1. Wprowadzenie
Mechanizm przetwarzania sygnałów mowy przez wyższe piętra układu słuchowego nadal nie został w pełni wyjaśniony. Przedmiotem aktualnych zainteresowań lekarzy, neurobiologów oraz fizyków medycznych z ośrodków naukowych na całym świecie stało się zagadnienie dotyczące neuronowego podłoża efektu "cocktail party". Jest to niezwykła zdolność człowieka do skupienia się i rozumienia treści wypowiadanej przez jednego (wybranego) mówcę w rzeczywistej scenerii akustycznej, w której więcej niż jedna osoba mówi jednocześnie. Jedne z istotniejszych badań ostatnich lat dowiodły, że struktury korowe potrafią selektywnie śledzić obwiednię amplitudową sygnału mowy oraz jej dynamikę [1].
Zmiany wartości chwilowych obwiedni amplitudowej i struktury widmowej sygnału mowy odzwierciedlane są w aktywności struktur mózgowych w trakcie słuchania [2, 3, 4, 5, 6, 7], a zjawisko to nazywane jest synchronizacją korową (ang. cortical entrainment). Jako, że człowiek sam decyduje na jakim źródle dźwięku koncentruje się, można powiedzieć, że synchronizacja ta jest modulowana przez jego uwagę [8, 9]. W kontekście eksperymentalnym oznacza to, że na podstawie poziomu synchronizacji bodźców z poszczególnych źródeł (bądź ich mieszaniny) z zarejestrowanymi sygnałami EEG lub MEG (zawierającymi odpowiedzi na te bodźce) można określić źródło, na którym słuchacz skupia swoją uwagę. Wykazano ponadto, że możliwa jest rekonstrukcja "celowanego" sygnału mowy (sygnału skupienia) z przebiegu nawet pojedynczego zapisu EEG.
Pomimo coraz większej liczby publikacji dotyczących aktywności kory mózgowej podczas "śledzenia" rytmu bodźca akustycznego [10, 2, 11, 12, 13, 14], nadal nie jest w pełni jasne w jaki sposób synchronizacja ta funkcjonuje w bardziej złożonych środowiskach dźwiękowych. W ogólnym przypadku zdolność percepcji mowy (jej zrozumiałość oraz trudność słuchania) pogarsza się wraz z postępującą
degradacją sygnału mowy, na którą wpływają zarówno parametry akustyczne pomieszczeń (takie jak pogłos) jak i zakłócenia addytywne czyli interferujące szumy lub inna mowa. W ramach niniejszej pracy licencjackiej przeprowadzone zostaną badania nad detekcją uwagi słuchowej w scenerii "cocktail party" w warunkach pogłosowych.
Wyniki eksperymentów dostarczą danych służących do określenia sposobu przetwarzania przez korę słuchową informacji dźwiękowej zniekształconej pogłosem (u osób otologicznie zdrowych). Taka wiedza może być wykorzystana w tworzeniu modeli i algorytmów skutecznej identyfikacji śledzonego sygnału. Obecnie wydaje się to być niezwykle istotne w kontekście tworzenia nowej generacji aparatów słuchowych zintegrowanych z systemami EEG (a zatem sterowanych bezpośrednio sygnałami ze struktur mózgowych).
---------------
2. Podstawy teoretyczne
2.1 Percepcja sygnału mowy w warunkach pogłosowych
Pogłos (zakłócenie splotowe) to termin opisujący mnogie odbicia dźwięku, które z pewnym opóźnieniem czasowym nakładają się na dźwięk propagujący się bezpośrednio. W warunkach bezpogłosowych sygnał mowy pozostaje nienaruszony tzn. fala wejściowa jest taka sama jak fala wyjściowa. Sytuacja taka występuje jedynie w polu swobodnym lub w komorach bezechowych nie mających jednak wiele wspólnego z warunkami rzeczywistymi, gdzie nakładające się odbicia sygnału towarzyszą nam nieustannie. Mimo, iż pogłos pozwala słuchaczowi na uzyskanie wrażenia pewnej przestrzenności dźwięku, jest on ogólnie uznany za zjawisko niepożądane, gdyż zniekształca sygnały akustyczne obniżając tym samym - w przypadku mowy - jej zrozumiałość [15, 16]. Ponadto, zakłócenia splotowe mogą być czynnikiem prowadzącym do znużenia poznawczego a tym samym zmniejszenia funkcjonalności pamięci operacyjnej [17], szczególnie gdy odbieranie mowy (słuchanie ze skupieniem) trwa przez dłuższy czas.