Голосовая связь : H.323

Техники кодирования сигналов

5 апреля 2016 - Машинный перевод
Другие версии: PDF-версия:pdf | Английский (22 августа 2015) | Отзыв


Содержание


Введение

Хотя аналоговая связь наиболее распространена, передача аналогового сигнала не особенно эффективна. Когда аналоговые сигналы ослабляются из-за потерь при передаче, становится трудно выделить сложную аналоговую структуру из случайного шума на линии. При усилении аналоговых сигналов также усиливается и шум, и в конечном счете аналоговые соединения становятся слишком шумными для использования. Цифровые сигналы, имея лишь два состояния — логическая единица и ноль — легче выделяются из шума. Они могут быть усилены без искажения. Цифровое кодирование менее уязвимо к шумовому искажению на междугородных и международных соединениях. Кроме того, системы связи во всем мире перешли на формат цифровой передачи, именуемый импульсно-кодовой модуляцией (ИКМ / PCM). ИКМ является типом кодирования, основанном на представлении формы сигнала: в нем создается зашифрованная форма исходного речевого сигнала. В этом документе детально описывается процесс преобразования аналоговых голосовых сигналов в цифровые.

Предварительные условия

Требования

Для этого документа отсутствуют особые требования.

Используемые компоненты

Настоящий документ не имеет жесткой привязки к каким-либо конкретным версиям программного обеспечения и оборудования.

Условные обозначения

Дополнительные сведения об условных обозначениях см. в документе Технические рекомендации Cisco. Условные обозначения.

Импульсно-кодовая модуляция

PCM — это метод кодирования по форме сигнала, заданный в спецификации ITU-T G.711.

Фильтрация

Первый шаг для преобразования сигнала из аналого-цифрового должен отфильтровать компонент с более высокой частотой сигнала. Это делает вещи более простым нисходящим для преобразования этого сигнала. Большая часть энергии разговорного языка где-нибудь между 200 или 300 герц и приблизительно 2700 или 2800 герц. Примерно и стандартная голосовая связь с 3000 ширинами полосы пропускания (в Гц) для стандартного речевого сигнала установлена. Поэтому у них не должно быть точных фильтров (это очень дорого). Пропускная способность 4000 герц сделана из точки оборудования если представление. Этот фильтр, ограничивающий полосу, используется для сглаживания. Такое случается, если входящий аналоговый голосовой сигнал оцифрован с недостаточной дискретизацией, что по критерию Нюквиста как Fs < 2(BW). Частота дискретизации является меньше, чем максимальная частота входного аналогового сигнала. Это создает наложение между спектром частот выборок и входным аналоговым сигналом. Фильтр исходящих данные низких частот, используемый для восстановления исходного входящего сигнала, не достаточно умен для обнаружения этого наложения. Поэтому это создает новый сигнал, который не происходит из источника. Это создание ложного сигнала, когда выборку вызывают, искажая.

Выборка

Действие второе для преобразования аналогового голосового сигнала в сигнал оцифрованной речи должно произвести выборку Фильтрованного входящего сигнала в постоянной частоте дискретизации. Это выполнено при помощи процесса, названного импульсной - амплитудной модуляцией (PAM). Этот шаг использует исходный аналоговый сигнал для модуляции амплитуды последовательности импульсов, которая имеет постоянную амплитуду и частоту. (см. рис. 2).)

Последовательность импульсов перемещается в постоянную частоту, названную частотой дискретизации. Аналоговый голосовой сигнал может быть выбран в миллион раз в секунду или в два - три раза в секунду. Как определена частота выборки? Ученый именем Гарри Найквиста обнаружил, что исходный аналоговый сигнал может быть восстановлен, если взято достаточно выборок. Он решил, что, если частота дискретизации является, по крайней мере, дважды максимальной частотой исходного входного аналогового голосового сигнала, этот сигнал может быть восстановлен фильтром нижних частот в назначении. Критерий устойчивости Найквиста сообщается как это:

Fs > 2(BW)

Fs = Sampling frequency

BW = Bandwidth of original analog voice signal

Рис. 1: Аналоговая выборка

waveform_coding-1.gif

Оцифруйте голос

После того, как вы будете фильтровать и производить выборку (использование PAM) входного аналогового голосового сигнала, следующий шаг должен оцифровать эти выборки в подготовке к передаче по Сети телефонии. Процесс оцифровывания аналоговых голосовых сигналов называется кодово-импульсная модуляция PCM. Единственная разница между PAM и PCM - то, что PCM берет следующий этап процесса. PCM декодирует каждую аналоговую выборку с помощью слов двоичного кода. PCM имеет аналогово-цифровой преобразователь на исходной стороне и цифроаналогового преобразователя на стороне - получателе. PCM использует способ, названный квантованием для кодирования этих выборок.

Квантование и кодирование

Рис. 2: Pulse Code Modulation - теорема Найквиста

/image/gif/paws/8123/waveform_coding-2.gif

Дискретизация – это процесс преобразования любого выборочного аналогового значения в соответствующее дискретное значение, которому может быть назначено уникальное цифровое кодовое слово.

Когда выборки входного сигнала попадают на этап квантования, для них определяется интервал квантования. Все интервалы квантования равномерно распределены (равномерное квантование) по динамическому диапазону входящего аналогового сигнала. Каждому интервалу квантования назначают дискретное значение в форме слова двоичного кода. Стандартный используемый размер слова составляет восемь битов. Если входной аналоговый сигнал выбран 8000 раз в секунду, и каждой выборке дают кодовое слово, которое восемь битов длиной, то битовая скорость максимальной скорости передачи для Систем телефонии с помощью PCM составляет 64,000 битов в секунду. На рисунке 2 показан способ получения скорости передачи для PCM-системы.

Каждой входной выборке назначают интервал квантования, который является самым близким к его амплитуде. Если входной выборке не назначают интервал квантования, который совпадает с его фактической высотой, то ошибка введена в процесс PCM. Эта ошибка называется шумом квантования. Шум квантования эквивалентен случайному шуму, который влияет на отношение сигнала к шуму (SNR) голосового сигнала. SNR является мерой уровня сигнала относительно фонового шума. Соотношение обычно измеряется в децибелах (дБ). Если сила входящего сигнала в микровольтах По сравнению с, и уровнем шума, также в микровольтах, является Vn, то отношение сигнала к шуму, S/N, в децибелах даны формулой S/N = 20 log10 (Vs/Vn). SNR измерен в децибелах (дБ). Чем выше SNR, тем лучше качество голосовой связи. Шум квантования уменьшает SNR сигнала. Таким образом, увеличение шума квантования уменьшает качество голосового сигнала. На рисунке 3 показано, как генерируется шум квантования. Для кодирования цели N укусил метки квантования урожаев слова 2 Н.

Рис. 3: Аналого-цифровое преобразование

/image/gif/paws/8123/waveform_coding-3.gif

Один из способов уменьшить шум квантования – увеличить число интервалов квантования. Различие между высотой амплитуды входного сигнала и интервалом квантования уменьшается по мере увеличения интервалов квантования (увеличения интервалов уменьшают помехи квантования). Однако слова объема кода также должны быть увеличены в пропорции к увеличению интервалов квантования. Этот процесс представляет дополнительные проблемы, которые имеют дело с емкостью системы PCM обработать больше кодовых слов.

SNR (включая шум квантования) является синглом большая часть важного фактора, который влияет на качество голосовой связи в единообразном квантовании. Единообразное квантование использует равные уровни квантования всюду по всему динамическому диапазону входного аналогового сигнала. Поэтому низкие сигналы имеют маленький SNR (качество голосовой связи низкого уровня сигнала), и высокие сигналы имеют большой SNR (качество голосовой связи высокого уровня сигнала). Так как большинство генерируемых голосовых сигналов является низким видом, имение лучше качества голосовой связи в более высоких уровнях сигнала очень неэффективный путь оцифровать голосовые сигналы. Для улучшения качества голосовой связи в более низких уровнях сигнала единообразное квантование (универсальный PCM) заменено неоднородным процессом квантования, названным компандированием.

Компандирование

Компандирование означает сжатие аналогового сигнала на источнике и последующее расширение этого сигнала до исходного размера при достижении назначения. Термин компандирование создан путем объединения двух сроков, сжатия и расширения, в одно слово. Во время процесса компандирования входные выборки аналогового сигнала сжаты в логарифмические сегменты. Каждый сегмент тогда квантован и кодировал единообразное квантование использования. Процесс сжатия является логарифмическим. Сжатие увеличивается как типовое увеличение сигналов. Другими словами, большие типовые сигналы сжаты больше, чем меньшие типовые сигналы. Это заставляет шум квантования увеличиваться, когда увеличивается типовой сигнал. Логарифмическое увеличение шума квантования всюду по динамическому диапазону входного типового сигнала поддерживает SNR - константу всюду по этому динамическому диапазону. Стандарты ITU-T для компандирования называют А-законом и u-law.

Закон компандирования с A-характеристикой и u-характеристикой

А-закон и u-law являются схемами аудиосжатия (кодеки), определенные Консультативным комитетом по международной телефонной связи И Телеграфной связью (CCITT) G.711, которые сжимают 16-разрядные линейные данные PCM вниз к восьми битам логарифмических данных.

Компандер а-закона

Ограничивая линейные примеры значения двенадцатью битами величины, сжатие А-закона определено этим уравнением, где A является параметром сжатия (A=87.7 в Европе), и x является нормализованным целым числом, которое будет сжато.

/image/gif/paws/8123/formula.gif

Компандер u-law

Ограничивая линейные примеры значения тринадцатью битами величины, u-law (u-law и Му - законы используются взаимозаменяемо в этом документе) сжатие определено этим уравнением, где m является параметром сжатия (m =255 в США и Японии), и x является нормализованным целым числом, которое будет сжато.

/image/gif/paws/8123/formula2.gif

Стандарт а-закона прежде всего используется Европой и остальной частью мира. u-law используется Северной Америкой и Японией.

Сходства между A-law и u-law

  • Оба значения представляют собой линейную аппроксимацию логарифмического соотношения ввода/вывода.

  • Оба внедрены с помощью восьмиразрядных кодовых слов (256 уровней, один для каждого интервала квантования). Восьмиразрядные кодовые слова обеспечивают немного скорости 64 килобитов в секунду (Кбит/с). Это вычислено путем умножения частоты отсчетов (дважды входная частота) размером кодового слова (2 4 кГц x 8 битов = 64 кбит/с).

  • Оба разделяют динамический диапазон на в общей сложности 16 сегментов:

    • Восемь положительных и восемь отрицательных сегментов.

    • Каждый сегмент является дважды длиной предыдущей.

    • Унифицированное квантование используется в каждом сегменте.

  • Оба используют аналогичный подход к кодированию восьмиразрядного слова:

    • Первый (MSB) определяет полярность.

    • Биты два, три, и четыре определяют сегмент.

    • Заключительные четыре бита квантуют сегмент, более низкие уровни сигнала, чем А-закон.

Различия Между А-законом и u-law

  • Различные линейные аппроксимации ведут к различным длинам и наклонам.

  • Числовое назначение позиций разряда в восьмиразрядном кодовом слове к сегментам и уровням квантования в сегментах является другим.

  • А-закон дает больший динамический диапазон, нежели u-закон.

  • u-law предоставляет лучший сигнал/эффективность устранения искажений для сигналов нижнего уровня, чем А-закон.

  • А-закон требует 13 битов для унифицированного эквивалента PCM. u-law требует 14 битов для унифицированного эквивалента PCM.

  • Международное соединение должно использовать А-закон, u к преобразованию ответственность страны u-law.

Разностная импульсно-кодовая модуляция

Во время процесса PCM различия между входными типовыми сигналами минимальны. Дифференциальная ИКМ (DPCM) разработана, чтобы вычислить это различие и затем передать этот сигнал небольшой разницы вместо всего входного типового сигнала. Так как различием между входными выборками являются меньше, чем вся входная выборка, количество битов, требуемых для передачи, сокращено. Это обеспечивает сокращение пропускной способности, требуемой передать голосовые сигналы. Использование DPCM может уменьшить битовую скорость передачи речи вниз к 48 кбит/с.

Каким образом DPCM вычисляет разницу между текущим и предыдущим образцами сигнала? Первая часть DPCM работает так же, как PCM (поэтому она называется дифференциальной PCM). Выборка входного сигнала осуществляется с постоянной частотой дискретизации (превышающей частоту входного сигнала в два раза). Затем эти образцы корректируются с использованием процесса PAM. В этот момент начинает работу процесс DPCM. Отобранный входной сигнал хранится в блоке, который называется предиктором. Средство прогнозирования отправляет сохраненный дискретизированный сигнал через дифференцирующее устройство. Дифференциатор сравнивает предыдущий типовой сигнал с текущим типовым сигналом и передает это различие для квантования, и кодирование фазы PCM (эта фаза может быть единообразным разбиением на подгруппы или компандированием с А-законом или u-law). После квантования и кодирования, разностный сигнал передан к его конечному назначению. В принимающей стороне сети все инвертировано. Сначала разностный сигнал является dequantized. Затем этот разностный сигнал добавляется к образцу сигнала, который хранится в предикторе, и отправляется в фильтр нижних частот, в котором восстанавливается первоначальный входный сигнал.

DPCM является хорошим способом уменьшить битовую скорость для передачи речи. Однако это вызывает некоторые другие проблемы то соглашение с качеством голосовой связи. DPCM квантует и кодирует различие между предыдущим типовым входящим сигналом и текущим типовым входящим сигналом. DPCM разбивает на группы разностный сигнал, используя единообразное квантование. Единообразное квантование генерирует SNR, который является маленьким для маленьких входных типовых сигналов и большим для больших входных типовых сигналов. Таким образом, качество голосовой связи лучше на сигналах с высоким уровнем. Этот сценарий очень неэффективен, так как большинство сигналов, генерируемых человеческим голосом, является маленьким. Качество голосовой связи должно фокусироваться на низких сигналах. Для решения этой проблемы адаптивный DPCM разработан.

Адаптивный DPCM

Адаптивный DPCM (ADPCM) является методом кодирования формы сигнала, определенным в спецификации G.726 ITU-T.

ADPCM адаптирует уровни квантования разностного сигнала, который генерировал во время процесса DPCM. Как ADPCM адаптирует эти уровни квантования? Если разностный сигнал низок, ADPCM увеличивает размер уровней квантования. Если разностный сигнал высок, ADPCM уменьшает размер уровней квантования. Так, ADPCM адаптирует уровень квантования к размеру входного разностного сигнала. Это генерирует SNR, который универсален всюду по динамическому диапазону разностного сигнала. Использование ADPCM уменьшает битовую скорость передачи речи вниз к 32 кбит/с, половина битовой скорости PCM u-law или А-закона. ADPCM производит "междугородное качество" голос точно так же, как PCM u-law или А-закон. Кодер должен иметь петлю обратной связи, с помощью выходных битов кодера для перекалибрования квантизатора.

Особые шаги для 32 КБ/сек

Соответствует стандартам ITU G.726.

  • Переконвертируйте PCM-отрывки A-law или Mu-law в линейный PCM-отрывок.

  • Вычислите прогнозируемое значение следующего образца.

  • Определите разницу между фактическим образцом и ожидаемым значением.

  • Различие в коде как четыре бита, передайте те биты.

  • Возвратите четыре бита к средству прогнозирования.

  • Возвратите четыре бита к квантизатору.

Связанные обсуждения сообщества поддержки Cisco

В рамках сообщества поддержки Cisco можно задавать и отвечать на вопросы, обмениваться рекомендациями и совместно работать со своими коллегами.


Дополнительные сведения


Document ID: 8123