Spis treści
1. Wprowadzenie
2. Podstawy teoretyczne
2.1 Percepcja sygnału mowy w warunkach pogłosowych
2.2 Efekt "Cocktail Party"
2.3 Aktywność korowa podczas celowanego słuchania mowy oraz detekcja uwagi słuchowej (AAD) wraz z jej matematycznymi podstawami
3. Cel badań (To i to (pół strony))
4. Eksperyment:
4.1 Grupa badawcza
4.2 Aparatura
4.3 Przygotowania wstępne oraz ogólny przebieg eksperymentu
4.4 Sygnały oraz sceneria eksperymentalna
5. Analiza wyników
6. Dyskusja i podsumowanie
BIBLIOGRAFIA
ZAŁĄCZNIKI
1. Wprowadzenie
Mechanizm przetwarzania sygnałów mowy przez poszczególne piętra układu słuchowego nadal nie został w pełni wyjaśniony. Przedmiotem aktualnych zainteresowań fizyków, lekarzy oraz neurobiologów z ośrodków naukowych na całym świecie stało się zagadnienie dotyczące neuronowego podłoża efektu "cocktail party". Związane jest ono z niezwykłą zdolnością człowieka do skupienia się i rozumienia jednego (wybranego) mówcy w rzeczywistej scenerii akustycznej, w której więcej niż jedna osoba mówi jednocześnie. Badania ostatnich lat wyjaśniły wiele w tej kwestii uświadamiając nam, przede wszystkim, że struktury korowe uważnie śledzą obwiednię amplitudową mowy oraz zmiany w jej dynamice (O'Sullivan et al. 2014) .
Zmiany wartości chwilowych obwiedni amplitudowej i struktury widmowej sygnału mowy, odzwierciedlane są w aktywności struktur mózgowych w trakcie słuchania, a zjawisko to nazywane jest synchronizacją korową fal mózgowych (cortical entrainment) (Ding i Simon 2012, 2013, 2014; Ding et al. 2014; Zoefel i Van Rullen 2015; Crosse et al. 2016). Jako że to człowiek decyduje na jakim źródle dźwięku się koncentruje, można przyjąć, że synchronizacja ta jest modulowana przez jego uwagę (Mesgarani et al. 2012; Horton et al. 2013). W kontekście eksperymentalnym oznacza to, że na podstawie poziomu synchronizacji bodźców z poszczególnych źródeł (bądź ich mieszaniny) z zarejestrowanymi sygnałami EEG lub MEG (zawierającymi odpowiedzi na te bodźce) można określić źródło, na którym słuchacz skupia swoją uwagę. Ostatnie badania wykazały, że dokonać można rekonstrukcji "celowanego" sygnału mowy z danych otrzymanych nawet z pojedynczego zapisu EEG. Mimo coraz większej liczby publikacji dotyczących analizy zmian aktywności kory mózgowej podczas dynamicznego "śledzenia" rytmu bodźca akustycznego (Kerlin et al. 2010; Ding i Simon 2012; Koskinen et al. 2012; Mesgarani i Chang 2012; Power et al. 2012; Golumbic et al. 2013), nadal nie jest jasne w jaki sposób synchronizacja ta funkcjonuje w bardziej złożonych środowiskach dźwiękowych. W ogólnym przypadku zdolność percepcji mowy pogarsza się wraz z postępującą
degradacją sygnału mowy, na którą wpływają zarówno parametry akustyczne pomieszczeń (głównie pogłos) jak i zakłócenia addytywne czyli interferujące szumy lub inna mowa.
Wyniki badań przeprowadzonych w ramach niniejszej pracy dostarczą nowych danych, które będą pomocne w określeniu sposobu przetwarzania zniekształconej pogłosem informacji dźwiękowej przechodzącej przez niższe i wyższe piętra układu słuchowego (u osób otologicznie zdrowych), a wiedza ta może być wykorzystana bezpośrednio w tworzeniu modeli i algorytmów skutecznej identyfikacji śledzonego sygnału. Jest to niezwykle istotne w kontekście tworzenia nowej generacji aparatów słuchowych zintegrowanych z systemem EEG, a zatem sterowanych bezpośrednio sygnałami z mózgu.
2. Podstawy teoretyczne
2.1 Percepcja sygnału mowy w warunkach pogłosowych
Pogłos to termin opisujący mnogie odbicia dźwięku, które z pewnym opóźnieniem czasowym nachodzą na dźwięk propagujący się bezpośrednio. W warunkach bezpogłosowych sygnał mowy pozostaje nienaruszony tzn. fala wejściowa jest taka sama jak fala wyjściowa. W polu wolnym sytuację taką można sztucznie zaaranżować jedynie w komorach bezechowych nie mających jednak wiele wspólnego z warunkami rzeczywistymi, gdzie nakładające się odbicia sygnału towarzyszą nam nieustannie. Mimo, iż pogłos pozwala słuchaczowi na uzyskanie wrażenia pewnej przestrzenności dźwięku, jest on ogólnie uznany za zjawisko niepożądane, gdyż zniekształca sygnały akustyczne, obniżając tym samym zrozumiałość mowy (Bolt i MacDonald 1949, Nábělek et al. 1989). Ponadto, zakłócenia splotowe mogą być czynnikiem prowadzącym do znużenia poznawczego a tym samym zmniejszenia funkcjonalności pamięci operacyjnej (Kjellberg 2004), szczególnie gdy odbieranie mowy (słuchanie ze skupieniem) trwa przez dłuższy czas.