КАТЕГОРИИ: Архитектура-(3434)Астрономия-(809)Биология-(7483)Биотехнологии-(1457)Военное дело-(14632)Высокие технологии-(1363)География-(913)Геология-(1438)Государство-(451)Демография-(1065)Дом-(47672)Журналистика и СМИ-(912)Изобретательство-(14524)Иностранные языки-(4268)Информатика-(17799)Искусство-(1338)История-(13644)Компьютеры-(11121)Косметика-(55)Кулинария-(373)Культура-(8427)Лингвистика-(374)Литература-(1642)Маркетинг-(23702)Математика-(16968)Машиностроение-(1700)Медицина-(12668)Менеджмент-(24684)Механика-(15423)Науковедение-(506)Образование-(11852)Охрана труда-(3308)Педагогика-(5571)Полиграфия-(1312)Политика-(7869)Право-(5454)Приборостроение-(1369)Программирование-(2801)Производство-(97182)Промышленность-(8706)Психология-(18388)Религия-(3217)Связь-(10668)Сельское хозяйство-(299)Социология-(6455)Спорт-(42831)Строительство-(4793)Торговля-(5050)Транспорт-(2929)Туризм-(1568)Физика-(3942)Философия-(17015)Финансы-(26596)Химия-(22929)Экология-(12095)Экономика-(9961)Электроника-(8441)Электротехника-(4623)Энергетика-(12629)Юриспруденция-(1492)Ядерная техника-(1748) |
Кодирование речевых сигналов
При рассмотрении цифровых методов обработки модель речевого сигнала часто представляют в виде эргодического случайного процесса. Стационарный случайный процесс называют эргодическим, если при нахождении его моментных функций усреднение по ансамблю реализаций можно заменить усреднением по времени. Момент n-го порядка случайной величины есть среднее значение n-ой степени случайной величины: Для использования статистических понятий при описании речевых сигналов необходимо оценить корреляционную функцию (или спектральную плотность мощности) и функцию плотности модели речевого сигнала. Количественной характеристикой степени статистической связи двух сечений случайного процесса служит их ковариационная или корреляционная функция. Корреляционная функция – с вычетом постоянной составляющей. Каждая отдельно взятая реализация случайного процесса представляет собой детерминированную функцию, к которой можно применить преобразование Фурье. Различные реализации одного случайного процесса будут иметь различные спектральные плотности. Статистически усредненной спектральной характеристикой случайного процесса является спектральная плотность мощности (СПМ), или спектр мощности. СПМ – вещественная функция, не содержащая информации и фазовых составляющих случайного процесса. СПМ не позволяет восстановить отдельные реализации случайного процесса. СПМ является четной неотрицательной функцией. Функция плотности вероятности (ФПВ) речевого сигнала оценивается путем определения гистограммы по большому числу отсчетов речевого сигнала, т.е. по длительной временной реализации. Экспериментальные исследования показали, что хорошей аппроксимацией экспериментальной функции плотности вероятности служит гамма-распределение. Более простой аппроксимацией является распределение Лапласа. Если частота дискретизации сигнала менее чем в 2 раза превышает верхнюю частоту спектра сигнала, то восстановление исходного сигнала оказывается невозможным. При этом возникают ошибки двух видов: связанные с усечением спектра исходного сигнала и связанные с наложением копий спектра, появляющихся в результате дискретизации. Идеальный фильтр нижних частот (ФНЧ) с прямоугольной АЧХ выделяет составляющие спектра, расположенные в интервале Найквиста, т.е. в диапазоне от 0 до Для передачи дискретной последовательности отсчетов по цифровому каналу связи необходимо каждый отсчет проквантовать до конечного множества уровней. В результате кодирования каждому квантованному значению Чаще всего для кодирования квантованных отсчетов используется двоичная последовательность. С помощью В общем случае полагают, что отсчеты сигнала попадают в конечный интервал значений. Поскольку величина
Апертура квантователя делится на интервалы, и всем отсчетам входного сигнала, попавшим в некоторый интервал, приписывается одно и то же значение. Уровни квантования часто выбирают равномерно. Если начало отсчета приходится на середину между уровнями квантования, то квантователь называется квантователем с усечением, если на определенный уровень квантования – квантователем с округлением.
Если число уровней квантования равно целой степени 2, то квантователь с усечением имеет одинаковое количество положительных и отрицательных уровней, расположенных симметрично относительно начала координат. Квантователь с округлением имеет на один отрицательный уровень больше, зато обладает нулевым уровнем. Кодовые слова, соответствующие уровням квантования, можно рассматривать как номер уровня квантования со знаком. Параметры При изучении эффектов квантования полезно представить квантованный сигнал в виде суммы неквантованного сигнала и ошибки квантования (шума квантования). При равномерном квантовании ошибка квантования не превышает половины Оценка отношения сигнал-(шум квантования) определяется выражением:
Данное соотношение показывает, что добавление одного разряда в кодовом слове повышает отношение сигнал-(шум квантования) на 6 дБ. Это соотношение справедливо при следующих предположениях: 1) справедлива описанная выше статистическая модель шума квантования; 2) диапазон квантования превышает размах сигнала. Первое из условий выполняется, если кодовое слово содержит не менее 6 бит. Второе условие выполняется, если кодовое слово содержит не менее 11 бит, поскольку динамический диапазон речевого сигнала при художественном чтении может достигать 40..50 дБ. Для одного и того же диктора амплитуда речевого сигнала существенно меняется. Дисперсия на невокализованных сегментах речи может быть на 20..30 дБ меньше, чем дисперсия на вокализованных сегментах. Т.о., кратковременное отношение сигнал-шум может изменяться в значительных пределах. Для поддержания ошибки квантования на приемлемом уровне необходимо выбирать количество уровней квантования, исходя из дисперсии сигнала на вокализованных сегментах речи, т.е. на невокализованных сегментах будет наблюдаться избыток уровней квантования. Таким образом, желательно иметь устройство квантования, при котором отношение сигнал-(шум квантования) не зависит от уровня сигнала. Вместо постоянной не зависящей от уровня сигнала ошибки квантования требуется иметь постоянную относительную ошибку. Данный эффект достигается путем использования неравномерного распределения уровней квантования. На рисунке представлена структурная схема кодирующей и декодирующей частей при использовании мгновенного компандирования.
Вместо квантования исходного сигнала для достижения постоянной ошибки квантуется логарифм сигнала. Перед квантованием осуществляется т.н. компрессия входного сигнала в логарифмическом преобразователе, а выходной сигнал после декодирования экспандируется с помощью экспоненциального преобразования.
Следовательно, отношение сигнал-(шум квантования) не зависит от мощности сигнала, а зависит только от величины шага квантования. Данный квантователь не имеет практического значения, поскольку динамический диапазон изменения уровня сигнала Использование практически реализуемой системы компрессор-экспандер представлено на рисунке.
Характеристика компрессора, названная
где
В Европе используется А-закон компандирования:
Стандартным значением является На рисунке представлено семейство характеристик компрессора при использовании
Выражение для оценки отношения сигнал-(шум квантования) (слайд 28) зависит от разрядности кодового слова и величины
На рисунке представлены зависимости отношения сигнал-(шум квантования) от отношения
Из анализа зависимостей следует, что при равномерном квантовании для заданного значения Таким образом, при квантовании речевого сигнала с одной стороны, шаг квантования следует выбирать достаточно большим для согласования диапазона квантования с размахом сигнала, с другой, шаг квантования следует сделать малым для уменьшения шума квантования. Это еще более усложняется нестационарным характером речевого сигнала и его последующей передачей по каналу связи. Амплитуда речевого сигнала может изменяться в широких пределах в зависимости от диктора, условий передачи, а также внутри фразы при переходе от вокализованного к невокализованному сегменту. Один из методов учета этих флуктуации состоит в применении неравномерного квантования. Другой метод состоит в адаптации свойств квантователя к уровню входного сигнала. Если адаптивное квантование применяется непосредственно к отсчетам входного сигнала, то такой метод обработки называется адаптивной ИКМ или сокращенно АИКМ. Основная идея адаптивного квантования состоит в том, что шаг квантования (или, в общем случае, интервалы и уровни квантования) изменяется таким образом, чтобы соответствовать изменяющейся дисперсии входного сигнала. Другой метод адаптации соответствует случаю, когда характеристики квантователя не изменяются, а постоянный уровень дисперсии поддерживается за счет переменного коэффициента усиления. В первом случае шаг квантования должен увеличиваться или уменьшаться при увеличении или уменьшении дисперсии входного сигнала соответственно. В случае неравномерного квантования это приводит к соответствующему масштабированию интервалов и уровней квантования. Во втором подходе, применимом в равной мере как к равномерному, так и к неравномерному квантователям, коэффициент усиления изменяется обратно пропорционально дисперсии входного сигнала так, чтобы поддерживать ее постоянной. В обоих случаях необходимо оценивать изменяющиеся вo времени характеристики сигнала. При изучении текущих свойств сигнала полезно выяснить, как быстро происходят их изменения. Максимальное значение амплитуды сигнала на невокализованном или вокализованном сегменте речи остаются относительно постоянными в течение длительного интервала времени. Такие изменения называются слоговыми, и это означает, что они проявляются на интервалах времени, сравнимых по протяженности с длительностью одного слога. При рассмотрении методов квантования целесообразно их классифицировать в соответствии с тем, медленно или быстро происходит адаптация, т.е. является она слоговой или мгновенной. Имеется два класса схем адаптивного квантования. В первом: амплитуда или дисперсия входного сигнала оценивается непосредственно по этому сигналу. Такие схемы называются квантователями с адаптацией по входу. В схемах второго класса шаг квантования подстраивается по выходному сигналу или, что то же самое, по выходной последовательности кодовых слов. Это квантователи с адаптацией по выходу. В обоих случаях адаптация может быть как слоговой, так и мгновенной. На рисунке показана в общем виде схема квантователя с адаптацией по входному сигналу.
Для простоты полагается, что квантователь равномерный и, таким образом, достаточно изменять только шаг квантования. Полученные результаты затем легко можно обобщить на случай неравномерного квантования. Шаг квантования должен быть известен на приемной стороне. Таким образом, отсчет описывается кодовым словом и шагом квантования. Если На рисунке изображена общая схема квантователя с адаптацией по входу на основе усилителя с переменным коэффициентом усиления.
В этом случае квантованный сигнал описывается совместно кодовым словом и коэффициентом усиления. В большинстве схем квантователей с адаптацией по входу используется оценка дисперсии входного сигнала. В этом случае шаг или уровни квантования устанавливаются пропорционально среднему квадратическому отклонению сигнала, а коэффициент усиления — обратно пропорционально. Общий подход состоит в предложении, что дисперсия пропорциональна кратковременной энергии, которая представляет собой сигнал на выходе фильтра нижних частот, на входе которого действует сигнал
Здесь Можно показать, что при адаптации по шагу квантования шаг пропорционален Параметр Оценка среднеквадратического отклонения представляет собой медленно меняющуюся по сравнению с исходным сигналом функцию времени. Частота дискретизации функции зависимости коэффициента усиления или шага квантования от времени определяется шириной полосы пропускания ФНЧ. Для При использовании адаптации по выходному квантованному сигналу, т.е. по последовательности кодовых слов, также может регулироваться шаг квантования или коэффициент усиления.
Преимущество таких схем – шаг квантования или коэффициент усиления не требуется передавать по каналу связи, т.к. они получены по последовательности кодовых слов. Недостаток – высокая чувствительность к ошибкам в кодовых словах, поскольку эти ошибки приводит не только к неправильной установке уровня квантования, но и к ошибкам в шаге квантования. Оценка дисперсии Адаптивное квантование не может дать существенный выигрыш в скорости передачи, поскольку используется информация только о распределении мгновенных значений речевого сигнала. Поэтому чаще используются методы разностного квантования, основанные на корреляционной связи между соседними отсчетами. Между отсчетами речевого сигнала имеется значительная корреляционная связь, которая медленно убывает по мере увеличения интервала между отсчетами. Значит, разность между соседними отсчетами будет иметь меньшую дисперсию, чем исходный сигнал. При использовании методов разностного квантования квантованию подвергается разность между предсказанным и действительным значениями сигнала, или погрешность предсказания. Квантователь может быть адаптивным или неадаптивным, равномерным или неравномерным. Если параметры предсказателя соответствуют параметрам речевого сигнала, то дисперсия разностного сигнала будет меньше, чем дисперсия исходного сигнала, поэтому квантователь с заданным количеством уровней квантования обеспечит меньший шум квантования. Величина выигрыша от использования разностного квантования зависит от корреляционной функции речевого сигнала. Один и тот же предсказатель не может быть оптимальным для различных дикторов, что обуславливает применение адаптивных предсказателей. Простейший вид разностного квантования – дельта-модуляция. В таких системах частота дискретизации выбирается во много раз выше, чем частота в соответствии с теоремой Котельникова. В результате соседние отсчеты оказываются в большой степени коррелированными. При уменьшении периода дискретизации можно более точно предсказать текущий отсчет по предшествующим и, следовательно, уменьшить дисперсию погрешности предсказания. Поэтому даже «грубый» квантователь может дать хорошие результаты. В системе с дельта-модуляцией используется простой одноразрядный (двухуровневый) квантователь. Таким образом, скорость передачи при использовании дельта-модуляции численно равна частоте дискретизации. Схема простейшей системы с дельта-модуляцией приведена на рисунке.
Квантователь имеет только два уровня и фиксированный шаг квантования. Представленный на рисунке предсказатель является одношаговым первого порядка. Положительный уровень квантования соответствует
При Для того чтобы последовательность отсчетов
В противном случае восстановленный сигнал будет «отставать» от исходного. Данный вид искажений называется «перегрузкой по крутизне». Поскольку максимальная крутизна Шаг квантования определяет также и максимальную ошибку, когда крутизна сигнала мала. При этом сигнал на выходе квантователя представляет собой переменную последовательность нулей и единиц, что приводит к флуктуации восстановленного сигнала вокруг постоянного уровня с размахом, равным Для получения большого динамического диапазона необходимо иметь большой шаг квантования; в то же время для точного описания малых сигналов шаг квантования должен быть малым. В данном случае это относится к динамическому диапазону и амплитуде разностного сигнала (или производной аналогового сигнала). Выбор шага квантования, минимизирующего среднее квадратическое значение шума квантования, приведет к компромиссу между перегрузкой по крутизне и шумом дробления. Исследования показали, что значение оптимального шага квантования определяется согласно выражению При удвоении При использовании оптимального шага квантования отношение сигнал-(шум квантования) достаточно сильно зависит от уровня входного сигнала, т.е. наилучшее качество достигается для узкого диапазона уровней входного сигнала. Для получения хорошего качества восстановленного на приемной стороне речевого сигнала, сравнимого с качеством семиразрядной логарифмической ИКМ, требуется значительно большая скорость. Основное достоинство ЛДМ состоит в ее простоте. Система может быть реализована на простом цифровом интеграторе и, поскольку используется только одноразрядный код, не требовать никакой синхронности по кодовым словам между передатчиком и приемником. Ограничение ЛДМ состоит в весьма грубом квантовании погрешности предсказания. Очевидно, что использование адаптивных методов может существенно улучшить характеристики дельта-модулятора. Наибольший интерес представляют простые адаптивные схемы, которые улучшают характеристики, но не приводят к существенному усложнению системы передачи. Большинство адаптивных методов дельта-модуляции основано на адаптации по выходу, когда шаг квантования перестраивается по выходной последовательности кодовых слов. Общий вид системы показан на рисунке.
Подобные схемы обладают тем преимуществом, что не требуют синхронизации по кодовым словам, поскольку при отсутствии ошибок шаг квантования как передатчика, так и приемника перестраивается в одной и той же кодовой последовательности. Шаг квантования изменяется по следующему правилу:
Выбор рассмотренного метода адаптации объясняется видом последовательности кодовых слов в ЛДМ. Период перегрузки по крутизне соответствует отрезкам последовательности, состоящим только из нулей или только из единиц. Период шума дробления соответствует последовательности из чередующихся нулей и единиц. На рисунке представлены результаты моделирования на речевом сигнале при
Видно, что значение отношения сигнал-(шум квантования) достигает максимума при На рисунке представлено квантование с помощью дельта-модулятора с адаптацией и без адаптации.
Начальный участок области большой крутизны порождает последовательность нулей, но в этом случае шаг квантования увеличивается экспоненциально, что позволяет следить за увеличением крутизны входного сигнала. Области дробления соответствует чередующаяся последовательность из нулей и единиц, но шаг квантования быстро уменьшается до минимального и остается таковым до тех пор, пока крутизна мала. Поскольку минимальный шаг квантования может быть сделан значительно меньше, чем тот, который необходим для оптимальной работы ЛДМ, шум дробления может быть существенно уменьшен. Аналогично максимальную величину шага квантования можно сделать больше, чем максимальная крутизна входного сигнала, что приведет к уменьшению шума перегрузки по крутизне. Улучшение качества системы с адаптивной дельта-модуляцией (АДМ) достигнуто путем ее незначительного усложнения. Поскольку адаптация осуществляется по выходному потоку двоичных символов, система с АДМ сохраняет основное преимущество систем с дельта-модуляцией, т.е. не требует синхронизации по кодовым словам. Дельта-модулятор является одноразрядной системой с ИКМ. В общем случае термин «разностная ИКМ» применяется по отношению к системам, в которых квантователь имеет более двух уровней квантования. Системы с разностной ИКМ обеспечивают выигрыш от 4 дБ до 11 дБ по сравнению с прямым квантованием ИКМ. Наибольший выигрыш достигается при переходе от системы без предсказания к предсказателю первого порядка. При увеличении порядка предсказателя более 4..5 выигрыш растет незначительно. Системы с разностной ИКМ могут обеспечить заданное отношение сигнал-(шум квантования) при меньшей на единицу разрядности по сравнению с прямым квантованием. Каждый дополнительный разряд кодового слова для разностной ИКМ увеличивает отношение сигнал-(шум квантования) на 6 дБ. Использование На рисунке представлена структурная схема адаптивной дифференциальной ИКМ (АДИКМ) с адаптацией по входу шага квантования.
Шаг квантования пропорционален дисперсии сигнала на его входе. Поскольку разностный сигнал На рисунке представлена структурная схема квантователя с адаптацией по выходу шага квантования в системе АДИКМ.
Исследования показали, что выигрыш по сравнению с неадаптивным квантованием по С целью учета нестационарности речевого сигнала и ослабление влияния диктора и речевого материала на качество функционирования системы передачи используется адаптивным предсказатель. Адаптивный предсказатель, как и адаптивный квантователь, отслеживает текущие изменения в речевом сигнале. На рисунках представлена структурная схема системы АДИКМ с адаптивным предсказателем по шагу квантования. Адаптация предсказателя и квантователя может осуществляться либо по входному, либо по выходному сигналу. При адаптации по входному сигналу для полного описания речевого сигнала к последовательности кодовых слов В случае АДИКМ с адаптацией по выходу по каналу связи передаются только последовательности кодовых слов. Но предсказание с управлением по выходу не получило широкого распространения из-за высокой чувствительности к ошибкам и худших характеристик, обусловленных использованием для управления искаженного входного сигнала.
Дата добавления: 2014-01-04; Просмотров: 1373; Нарушение авторских прав?; Мы поможем в написании вашей работы! |