Вокодер AMBE: как голос превращается в данные DMR

Категория: ОсновыСложность: ~9 мин

Нажали тангенту — рация не «записывает» голос как диктофон. Вместо этого специализированный алгоритм — вокодер — за доли секунды строит математическую модель вашей речи и отправляет в эфир крошечный поток данных. На принимающей стороне та же модель разворачивается обратно в звук. Именно поэтому DMR звучит чисто там, где аналоговая FM уже шипит: главный враг цифры — не слабый сигнал как таковой, а ошибки в битах.

Что такое вокодер и при чём тут MBE

Слово вокодер (vocoder) — сокращение от voice coder. В отличие от аудиокодеков (MP3, AAC), которые «фотографируют» сигнал, вокодер строит параметрическую модель речеобразования: как работают голосовые связки, как форма ротовой полости меняет тембр. Передавать эти параметры гораздо дешевле, чем сам звук.

AMBE (Advanced Multi-Band Excitation) — семейство вокодеров компании DVSI (Digital Voice Systems, Inc.), построенных на методе MBE (Multi-Band Excitation). Метод разделяет речевой сигнал на гармонические полосы и по каждой оценивает, насколько она «вокализована» (звонкая) или «шумовая» (шипящая). Это позволяет сохранить разборчивость речи при очень низких битрейтах.

AMBE+2: версия для DMR

Стандарт ETSI для DMR (TS 102 361-1) закрепил в качестве голосового кодека AMBE+2 — последнее на момент принятия стандарта поколение семейства. Ключевые числа:

Речевой поток: 2 450 бит/с — собственно параметры речи;
FEC (Forward Error Correction): 1 150 бит/с — избыточность для восстановления ошибок;
Итоговый поток на слот: 3 600 бит/с;
Размер кадра: 20 мс — каждые 20 мс из микрофона «срезается» фрагмент речи и превращается в один AMBE-кадр;
DMR-фрейм: 30 мс, содержит три AMBE-кадра по 72 бита каждый (итого 216 бит полезной нагрузки на голосовой фрейм).

Почему 3 600, а не 2 450? FEC добавляет ~47% избыточности. При пакетных ошибках в эфире это позволяет восстановить кадр без переспроса. Если ошибок слишком много — кадр «маскируется» интерполяцией по соседним; слышится характерный «пузырящийся» артефакт, а не белый шум аналоговой FM.

Где физически живёт вокодер

В профессиональных и любительских рациях AMBE+2 реализован одним из двух способов:

Аппаратный чип DVSI — например, AMBE-3000 или AMBE-2020. Это специализированная DSP-микросхема, выполняющая кодирование/декодирование в реальном времени с минимальной задержкой. Используется в большинстве портативных рабочих DMR-рациях (TYT, AnyTone, Hytera, Motorola).
Программная реализация — на достаточно мощном встроенном процессоре. Обычно встречается в IP-коммуникаторах (POC-станции) и приложениях на смартфонах, где вычислительная мощность позволяет не ставить отдельную микросхему.

В обоих случаях вокодер — часть рации, а не сети. Серверная инфраструктура видит уже закодированные кадры.

Задержка кодирования Один AMBE-кадр = 20 мс. Типичная сквозная задержка в DMR-хотспоте с сервером — порядка 100–300 мс. Это сравнимо с IP-телефонией и незаметно в обычном разговоре по тангенте.

Патентованный алгоритм: что это значит на практике

AMBE/AMBE+2 — патентованная технология DVSI. Производитель рации платит DVSI лицензионный сбор. Для конечного пользователя это означает несколько важных следствий:

Полноценной свободной (open-source) реализации AMBE+2 нет в публичном доступе — программный декодер потребовал бы лицензии.
Существующие «открытые» инструменты для декодирования голоса DMR (например, в SDR-сканерах) используют реверс-инженерные приближения или требуют аппаратный донгл DVSI.
Альтернативный вокодер Codec 2 (полностью открытый) используется в других режимах (FreeDV, M17), но не совместим с DMR ETSI по определению.

Важно Программные реализации AMBE для личного использования существуют «в серой зоне» патентного права. Коммерческое использование без лицензии DVSI незаконно. В любительской радиосвязи ситуация варьируется по юрисдикциям.

Как голос идёт через сеть DMRhub

В чистой DMR-сети голос проходит весь путь в одном и том же формате — закодированные AMBE+2-кадры. Это принципиальное отличие от аналогового ретранслятора, который «слышит» и переизлучает звук.

Вы нажали тангенту — чип в рации закодировал голос в поток AMBE+2-кадров.
Кадры по радио ушли на MMDVM-хотспот.
Хотспот завернул их в IP-пакеты (протокол MMDVM/Homebrew) и отправил на сервер-мастер DMRhub.
Сервер-мастер разослал те же пакеты всем абонентам активной talkgroup.
Рации получателей раскодировали AMBE+2 обратно в звук.

На всём этом пути никакого транскодинга нет. Сервер-мастер работает как коммутатор: маршрутизирует уже готовые голосовые кадры, не разворачивая их в PCM. Это делает инфраструктуру легковесной — транскодирование не требует ни аппаратных чипов DVSI на сервере, ни значительных вычислительных ресурсов.

Транскодинг: когда он всё же нужен

Проблема возникает на межрежимных шлюзах. D-STAR использует более старый кодек AMBE (без «+2»), C4FM/YSF — технически тот же AMBE+2, но в другой «упаковке» с иной сигнализацией. Если вы хотите связать DMR и D-STAR или DMR и YSF «голосом», шлюз обязан:

Декодировать AMBE+2-кадры DMR в PCM-аудио;
Перекодировать PCM обратно в нужный формат другой сети.

Для этого шлюзу нужен либо аппаратный USB-донгл DVSI (AMBE-3000 или аналог), либо лицензированная программная библиотека. Именно поэтому межрежимные рефлекторы — отдельный класс инфраструктуры. В нашей сети, работающей только в стандарте DMR, такого оборудования не требуется.

C4FM и AMBE+2 — «родственники», но не совместимы Motorola, Hytera (DMR) и Yaesu (C4FM/YSF) используют один и тот же вокодер AMBE+2 в своих системах. Но DMR и C4FM имеют разные протоколы модуляции, фреймирования и сигнализации. Прямой «нативный» приём одного на другом невозможен без транскодинга.

Качество звука и границы возможного

AMBE+2 звучит лучше своего предшественника AMBE (используемого в D-STAR) благодаря улучшенному алгоритму и встроенному FEC. При уровне BER ниже ~2–3% качество остаётся стабильным и разборчивым. При сильных ошибках вокодер маскирует повреждённые кадры — слышится «буль-буль» или кратковременный провал звука, после чего речь восстанавливается.

Принципиальное ограничение параметрического вокодера: он оптимизирован под человеческую речь. Музыка, свисты, сильные помехи на микрофоне звучат через AMBE+2 узнаваемо «синтетически» — алгоритм моделирует голосовой тракт, а не произвольный звуковой сигнал.

Голос в DMRhub идёт end-to-end без транскодинга

В нашей сети вокодер работает только в рации. Сервер-мастер гоняет уже закодированные AMBE+2-кадры как есть — никакого переперекодирования, никаких чипов DVSI на сервере. Чтобы выйти в эфир, достаточно рации с поддержкой DMR, своего DMR ID и хотспота или ближайшего репитера.

Собрать образ хотспота Получить DMR ID

DMR с нуляТаймслоты, talkgroup, Color Code DMR vs другие цифровые режимыD-STAR, C4FM, P25 — чем отличаются Частная vs публичная сетьЗачем своя инфраструктура POC-станцииРация в телефоне: как это работает

Источники

DVSI AMBE+2 Vocoder Technology (официальная страница продукта) — dvsinc.com
ETSI TS 102 361-1: DMR Air Interface protocol / голосовой кадр 216 бит, 3 × 72 бит AMBE+2 — cartoonman.github.io (DMR frame)
Multi-Band Excitation — Wikipedia (история MBE/IMBE/AMBE/AMBE+2, лицензирование) — en.wikipedia.org
What are Transcoding Reflectors (Silvercreek ARA) — транскодинг DMR/YSF/D-STAR — w8wky.org

В сети DMRhub

Настроили рацию — заходите в эфир: свой мастер, хотспоты и приложение с DMR прямо в телефоне.

Войти в портал