Детектирование речевой активности в автоматизированной системе распознавания диктора критического применения
Jazyk: | ukrajinština |
---|---|
Rok vydání: | 2017 |
Předmět: |
wavelet transformation
automated speaker recognition system of critical use вейвлет-преобразования згортальна нейромережа neural network автоматизированная система распознавания дикторов критического применения детектирования речевой активности speech activity detection вейвлет-перетворення автоматизована система розпізнавання мовців критичного застосування детектування мовної активності сверточная нейросеть |
Popis: | У статті автори розробили метод детектування мовної активності для автоматизованої системи розпізнавання мовців критичного застосування із вейвлет-параметризацією мовного сигналу та класифікацією на інтервали «мова»/«пауза» з використанням згортальної нейромережі. Запропонований авторами метод вейвлет-параметризації дозволяє обрати оптимальні параметри вейвлет- перетворення відповідно до заданої користувачем похибки подання мовного сигналу. Також метод до- зволяє здійснювати оцінювання втрат інформації залежно від вибраних параметрів неперервного вейвлет-перетворення (НВП), що дозволило зменшити кількість обчислюваних коефіцієнтів НВП мовного сигналу на порядок із допустимим ступенем спотворення локального спектра НВП. Також запропоновано алгоритм детектування мовної активності із згортальним нейромережевим класифікатором, який показує високу якість сегментації мовних сигналів на інтервали «мова»/«пауза» та є стійким до присутності у мовному сигналі вузькосмугового шуму і техногенних шумів за рахунок властивостей згортальної нейромережі. В статье авторы разработали метод выявления речевой деятельности для автоматизированной системы распознавания критического использования языков с вейвлет-параметризацией речевого сигнала и классификации с интервалами «языка»/«паузы» с помощью криволинейной нейронной сети. Предложенный авторами метод вейвлет-параметризации позволяет выбирать оптимальные параметры вейвлет-преобразования в соответствии с заданной пользователю ошибки представления речевого сигнала. Также метод позволяет оценить потерю информации в зависимости от выбранных параметров непрерывного преобразования вейвлета (АЭС), что позволило уменьшить количество масштабируемых коэффициентов ЛВП речевого сигнала в порядке величины с допустимой степенью искажения локальный спектр LVP. Также предложен алгоритм обнаружения речевой активности с классифицируемой криволинейной нейронной сетью, показывает высокое качество сегментации речевых сигналов с интервалами «язык»/«пауза» и устойчива к присутствиям в речевом сигнале узкополосных шумов и техногенных шумов, за счет свойств, обладаемых криволинейной нейронной сетью. In the article, the authors developed a method for detecting speech activity for an automated system for recognizing critical use of speeches with wavelet parameterization of speech signal and classification at intervals of “language”/“pause” using a curvilinear neural network. The method of wavelet-parametrization proposed by the authors allows choosing the optimal parameters of wavelet transformation in accordance with the user-specified error of presentation of speech signal. Also, the method allows estimating the loss of information depending on the selected parameters of continuous wavelet transformation (NPP), which allowed to reduce the number of scalable coefficients of the LVP of the speech signal in order of magnitude with the allowable degree of distortion of the local spectrum of the LVP. An algorithm for detecting speech activity with a curvilinear neural network classifier is also proposed, which shows the high quality of segmentation of speech signals at intervals "language" / "pause" and is resistant to the presence in the speech signal of narrowband noise and technogenic noise due to the inherent properties of the curvilinear neural network. |
Databáze: | OpenAIRE |
Externí odkaz: |