W 1982 roku Nábělek i Robinson [19] wykazali eksperymentalnie, że zrozumiałość czystego sygnału mowy (bez interferującego szumu
zakłócającego) zależy odwrotnie proporcjonalnie od czasu pogłosu, a zatem najbardziej optymalne warunki akustyczne odpowiadają zerowemu czasowi pogłosu.  Badania teoretyczne wykazały, że zależność pogłosu od zrozumienia mowy nie jest aż tak jednoznaczna.  Obecnie uznaje się, że "wczesne odbicia" są korzystne dla percepcji mowy, a jedynie "późny pogłos" jest niepożądanym zniekształceniem sygnału, które pogarsza możliwość identyfikacji mowy.  Bradley (1986) [20], korzystając z przewidywalnych i subiektywnych teoretycznych badań wartości parametru U50, wyznaczył zoptymalizowany czas pogłosu w pomieszczeniach dyfuzyjnych, który wynosił 0,4-0,5 s (dla pomieszczeń ze stałym szumem na zaniedbywalnym poziomie 30 dBA) .  Z obliczeń Bistafa (2000) [21] wynika, że przy stosunku szumu do sygnału mowy (+30 dB), najmniejszy czas pogłosu zaburzający niekorzystnie rozumienie mowy wynosi 0,2 s. Wytłumaczenie jest następujące: wraz ze zwiększaniem się czasu pogłosu (poczynając od zera), wzrasta również energia sygnału, który dociera od najwcześniejszych odbić, dzięki czemu zwiększa się zrozumiałość mowy. Jednak dzieje się tak do czasu, gdy na sygnał mowy nie zaczną wpływać wspomniane wcześniej efekty związane z wygładzeniem obwiedni amplitudowej. Wykazano również, że przeważający czynnik widma modulacji mowy ciągłej, w warunkach idealnych (bez odbić), pojawia się w zakresie od 2 do 8Hz  z maksimum w okolicy 4 Hz przy czym, bez względu na to jakiego dotyczy to języka, przebieg jest podobny [22, 23, 24]. Według Kusumoto i wsp. (2005) [25] sytuacja ta zmienia się w warunkach rzeczywistych (kiedy w pomieszczeniu występuje pogłos), kiedy to  maksimum widma obniża się z 4 Hz na 2 Hz, co skutkuje zmniejszeniem współczynnika modulacji (pogłos pełni rolę filtra dolnoprzepustowego).