..................
 SUMMARY
In the "cocktail party" acoustic scenery, our ability to selective attention is closely related to the activity of brain structures which promote the  tracking of the attended signal and  suppressing the ignored signal at the same time (so-called  phenomenon of cortical entrainment  or brainwave synchronization). The amplitude envelope of speech signal and the change of its dynamics are captured by the cortex while listening, and the activity of the brain structures are its reflection. So far, several authors have shown that the representation of the speech signal at the level of the auditory cortex is robust to additive distortions, which is why we can easily function in a real-life acoustic scenes. However, it is not known exactly how convolutional distortions (reverberation) are mirrored by a cortical entrainment mechanism ie how the real-world acoustic scene influences the effectiveness of auditory attention detection.     
The main aim of this Bachelor's thesis was to evaluate the effectiveness of Auditory Attention Detection (AAD) in the "cocktail party" scenery, while distorting the speech signal with moderate reverberation (0.7 s). An attempt was made to answer the question: how effective is the
the ability of humans to extract relevant sounds when speech perception takes place in everyday conditions?
Based on the obtained results, it has been shown that the effective detection of auditory attention in reverberation conditions is still possible and can reach up to 95%. At the same time, it was noticed that such additional distortion of speech can affect cortical entrainment in two ways. For some listeners, the presence of convolutional distortions significantly worsened their concentration, and instead of being directed at one speaker, their attention jumped between them. Consequently, the effectiveness of AAD decreased by values from the range 5-30%. In turn, in other listeners, the effectiveness of AAD increased by up to 15%, which could have been the result of some kind of auditory mobilization (strong focus on the sound) which made the activity of cortical structures clearly correlated with the targeted signal.
 
------------
Spis treści
1. Wprowadzenie
2. Podstawy teoretyczne
        2.1 Percepcja sygnału mowy w warunkach pogłosowych
        2.2 Efekt "cocktail party"
        2.3 Aktywność korowa podczas celowanego słuchania mowy oraz detekcja uwagi słuchowej (AAD) wraz z jej matematycznymi podstawami
3. Cel badań 
4. Eksperyment
        4.1 Grupa badawcza
        4.2 Aparatura
        4.3 Przygotowania wstępne oraz ogólny przebieg eksperymentu
        4.4 Sygnały oraz sceneria eksperymentalna  
5. Analiza wyników
6. Dyskusja i podsumowanie
BIBLIOGRAFIA
ZAŁĄCZNIKI
--------------------
1. Wprowadzenie 
    Mechanizm przetwarzania sygnałów mowy przez wyższe piętra układu słuchowego nadal nie został w pełni wyjaśniony. Przedmiotem aktualnych zainteresowań lekarzy, neurobiologów oraz fizyków medycznych z ośrodków naukowych na całym świecie stało się zagadnienie dotyczące  neuronowego podłoża efektu "cocktail party". Jest to niezwykła zdolność człowieka do skupienia się i rozumienia treści wypowiadanej przez jednego (wybranego) mówcę w rzeczywistej scenerii akustycznej, w której więcej niż jedna osoba mówi jednocześnie.  Jedne z istotniejszych badań ostatnich lat dowiodły, że struktury korowe potrafią selektywnie śledzić obwiednię amplitudową sygnału mowy oraz jej dynamikę [1].
     Zmiany wartości chwilowych obwiedni amplitudowej i struktury widmowej sygnału mowy odzwierciedlane są w aktywności struktur mózgowych w trakcie słuchania [2, 3, 4, 5, 6, 7],  a zjawisko to nazywane jest synchronizacją korową (ang. cortical entrainment). Jako, że człowiek sam decyduje na jakim źródle dźwięku koncentruje się, można powiedzieć, że synchronizacja ta jest modulowana przez jego uwagę [8, 9]. W kontekście eksperymentalnym oznacza to,  że na podstawie poziomu synchronizacji bodźców z poszczególnych źródeł (bądź ich mieszaniny) z zarejestrowanymi sygnałami EEG lub MEG  (zawierającymi odpowiedzi na te bodźce) można określić źródło, na którym  słuchacz skupia swoją uwagę.  Wykazano ponadto, że możliwa jest rekonstrukcja "celowanego" sygnału mowy (sygnału skupienia) z przebiegu nawet pojedynczego zapisu EEG.  
 Pomimo coraz większej liczby publikacji dotyczących aktywności kory mózgowej podczas "śledzenia" rytmu bodźca akustycznego [10, 2, 11, 12, 13, 14], nadal nie jest w pełni jasne w jaki sposób synchronizacja ta funkcjonuje w bardziej złożonych środowiskach dźwiękowych. W ogólnym przypadku zdolność percepcji mowy (jej zrozumiałość oraz trudność słuchania) pogarsza się wraz z postępującą degradacją sygnału mowy, na którą wpływają zarówno parametry akustyczne pomieszczeń (takie jak pogłos) jak i zakłócenia addytywne czyli interferujące szumy lub inna mowa. W ramach niniejszej pracy licencjackiej przeprowadzone zostaną badania nad detekcją uwagi słuchowej w scenerii "cocktail party" w warunkach pogłosowych.    
Wyniki eksperymentów dostarczą danych służących do określenia sposobu przetwarzania przez korę słuchową informacji dźwiękowej zniekształconej pogłosem (u osób otologicznie zdrowych).  Taka wiedza może być wykorzystana w tworzeniu modeli i algorytmów skutecznej identyfikacji śledzonego sygnału. Obecnie wydaje się to być niezwykle istotne w kontekście tworzenia nowej generacji aparatów słuchowych zintegrowanych z systemami EEG (a zatem sterowanych bezpośrednio sygnałami ze struktur mózgowych).     
 
---------------
2. Podstawy teoretyczne
    2.1 Percepcja sygnału mowy w warunkach pogłosowych
Pogłos (zakłócenie splotowe) to termin opisujący mnogie odbicia dźwięku, które z pewnym opóźnieniem czasowym nakładają się na dźwięk propagujący się bezpośrednio. W warunkach bezpogłosowych sygnał mowy pozostaje nienaruszony tzn. fala wejściowa jest taka sama jak fala wyjściowa. Sytuacja taka występuje jedynie w polu swobodnym lub w komorach bezechowych nie mających jednak wiele wspólnego z warunkami rzeczywistymi, gdzie nakładające się odbicia sygnału towarzyszą nam nieustannie.  Mimo, iż  pogłos pozwala słuchaczowi na uzyskanie wrażenia pewnej przestrzenności dźwięku, jest on ogólnie uznany za zjawisko niepożądane, gdyż zniekształca sygnały akustyczne obniżając tym samym - w przypadku mowy - jej zrozumiałość [15, 16].  Ponadto, zakłócenia splotowe mogą być czynnikiem prowadzącym do znużenia poznawczego a tym samym zmniejszenia funkcjonalności pamięci operacyjnej [17],  szczególnie gdy odbieranie mowy (słuchanie ze skupieniem) trwa przez dłuższy czas.