Popis: |
Показано, що для слухової системи людини прийнятними є фазові спотворення мовленнєвих сигналів, якщо максимальна різниця групових часів затримки в області високих і низьких частот не перевищує 50 мс – при такій різниці групових часів затримки інтерференція між суміжними голосними й приголосними звуками є практично непомітною на слух. Вказано значення об'єктивних показників якості мовлення у вигляді сегментного відношення сигнал-шум (SSNR), логарифмічно-спектральних спотворень (LSD), барк-спектральних спотворень (BSD) і перцептуальної оцінки якості мовлення (PESQ), що відповідають знайденому граничному значенню 50 мс. It is shown that phase distortion of speech signals are acceptable for human auditory system when the maximum difference of group delay times in the high and low frequencies is below 50 ms – the interference between adjacent vowels and consonants is not perceived with such a difference of group delay. There were founded values of objective measures of speech quality in the form of a segmental signal-to-noise ratio (SSNR), the log-spectral distortion (LSD), bark spectral distortion (BSD) and perceptual evaluation of speech quality (PESQ), according to the detected threshold value of 50 ms. Установлено, что для слуховой системы человека приемлемыми являются фазовые искажения речевых сигналов, если максимальная разница групповых времен задержки в области высоких и низких частот не превышает 50 мс – в этом случае интерференция между смежными гласными и согласными звуками на слух практически незаметна. Указаны значения объективных показателей качества речи в виде сегментного отношения сигнал-шум (SSNR), логарифмически-спектральных искажений (LSD), барк-спектральных искажений (BSD) и перцептуальной оценки качества речи (PESQ), соответствующие найденному пороговому значению 50 мс. |