Методические указания к выполнению работы. 1. Обнаружение и кодирование пауз речевого сигнала1. Обнаружение и кодирование пауз речевого сигнала. Данную процедуру можно реализовать используя следующий вычислительный алгоритм, приведенный ниже.
Словесное описание алгоритма 1. Ввести количество R частотных интервалов и значение длительности обрабатываемого отрезка сигнала N; 2. Для осуществить вычисления элементов матриц ; 3. Положить ; 4. Для вычислить матрицы и 5. Сформировать матрицу 6. Ввести заведомо относящиеся к паузе данные длительностью ;. 7. Для выполнить: 7.1. Ввести вектор значений обрабатываемого отрезка сигнала ; 7.2. Вычислить вектор 7.3.Для вычислить ; 8. Для вычислить 9. Для вычислить ; 10. Вычислить и ; 11. Ввести значение вероятности ложной тревоги ; 12. Выполнить итерации по определению порога: 12.1. Положить 12.2. Вычислить 12.3. Вычислить 12.4. Если то положить и прекратить итерации; 12.5. В противном случае при положить , если же выполняется неравенство , то положить , положить и перейти к выполнению 11.2; 13. Задать длительность , предназначенных для сжатия за счёт обнаружения и кодирования пауз данных; 14. Ввести предназначенные для обработки данные ; 15. Задать шаг смещения вдоль отрезка обрабатываемых данных К, такой, что отношение является целым числом; 16. Положить ; 17. Для выполнить: 17.1. Положить ; 17.2. Вычислить вектор 17.3. Для вычислить ; 17.4. Вычислить 17.5. Если , то принимается решение о наличии в анализируемом отрезке данных, порождаемых звуками речи, полагается и при выполнении условия выполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенства вычисления заканчиваются. В противном случае (неравенство не выполняется) принимается решение о принадлежности анализируемого отрезка данных паузе и выполняются следующие действия: 17.6. Если на предыдущем этапе (предыдущем k) не принималось решения о наличии паузы то началу новой паузы присваивается код, , а длительности присваивается значение , где - номер итерации при которой обнаружено начало n -той паузы в обрабатываемой совокупности данных. Если же и на предыдущем этапе отрезок анализируемых данных был отнесен к паузе номером n, то код начала паузы не изменяется, а длительность увеличивается на величину шага смещения, то есть вычисляется ; 17.7. Полагается и при выполнении условия выполняются предыдущие операции, начиная с подпункта 17.1, а при выполнении неравенства вычисления заканчиваются. 18. Конец. 2. Оценка эффективности работы алгоритма кодирования пауз в данной работе осуществляется аналогично предыдущей.
По результатам выполнения работы заполните таблицу 6.1. И дайте сравнительный анализ результатов работы данного алгоритма и технологии VAD, реализованной в лабораторной работе №5.
Таблица 6.1.
Контрольные вопросы к защите 1. В чем заключается сущность метода сжатия речевых данных за счет обнаружения пауз основанном на принципе учета отличий распределения энергии речевого сигнала по частотному диапазону, соответствующего звуку, по сравнению с распределением энергии сигнала в паузе? 2. Какая решающая функция используется в данном методе? 3. Каким образом выбирается порог h a?
|