Вокодер AMBE: как голос превращается в данные DMR
Нажали тангенту — рация не «записывает» голос как диктофон. Вместо этого специализированный алгоритм — вокодер — за доли секунды строит математическую модель вашей речи и отправляет в эфир крошечный поток данных. На принимающей стороне та же модель разворачивается обратно в звук. Именно поэтому DMR звучит чисто там, где аналоговая FM уже шипит: главный враг цифры — не слабый сигнал как таковой, а ошибки в битах.
Что такое вокодер и при чём тут MBE
Слово вокодер (vocoder) — сокращение от voice coder. В отличие от аудиокодеков (MP3, AAC), которые «фотографируют» сигнал, вокодер строит параметрическую модель речеобразования: как работают голосовые связки, как форма ротовой полости меняет тембр. Передавать эти параметры гораздо дешевле, чем сам звук.
AMBE (Advanced Multi-Band Excitation) — семейство вокодеров компании DVSI (Digital Voice Systems, Inc.), построенных на методе MBE (Multi-Band Excitation). Метод разделяет речевой сигнал на гармонические полосы и по каждой оценивает, насколько она «вокализована» (звонкая) или «шумовая» (шипящая). Это позволяет сохранить разборчивость речи при очень низких битрейтах.
AMBE+2: версия для DMR
Стандарт ETSI для DMR (TS 102 361-1) закрепил в качестве голосового кодека AMBE+2 — последнее на момент принятия стандарта поколение семейства. Ключевые числа:
- Речевой поток: 2 450 бит/с — собственно параметры речи;
- FEC (Forward Error Correction): 1 150 бит/с — избыточность для восстановления ошибок;
- Итоговый поток на слот: 3 600 бит/с;
- Размер кадра: 20 мс — каждые 20 мс из микрофона «срезается» фрагмент речи и превращается в один AMBE-кадр;
- DMR-фрейм: 30 мс, содержит три AMBE-кадра по 72 бита каждый (итого 216 бит полезной нагрузки на голосовой фрейм).
Где физически живёт вокодер
В профессиональных и любительских рациях AMBE+2 реализован одним из двух способов:
- Аппаратный чип DVSI — например, AMBE-3000 или AMBE-2020. Это специализированная DSP-микросхема, выполняющая кодирование/декодирование в реальном времени с минимальной задержкой. Используется в большинстве портативных рабочих DMR-рациях (TYT, AnyTone, Hytera, Motorola).
- Программная реализация — на достаточно мощном встроенном процессоре. Обычно встречается в IP-коммуникаторах (POC-станции) и приложениях на смартфонах, где вычислительная мощность позволяет не ставить отдельную микросхему.
В обоих случаях вокодер — часть рации, а не сети. Серверная инфраструктура видит уже закодированные кадры.
Патентованный алгоритм: что это значит на практике
AMBE/AMBE+2 — патентованная технология DVSI. Производитель рации платит DVSI лицензионный сбор. Для конечного пользователя это означает несколько важных следствий:
- Полноценной свободной (open-source) реализации AMBE+2 нет в публичном доступе — программный декодер потребовал бы лицензии.
- Существующие «открытые» инструменты для декодирования голоса DMR (например, в SDR-сканерах) используют реверс-инженерные приближения или требуют аппаратный донгл DVSI.
- Альтернативный вокодер Codec 2 (полностью открытый) используется в других режимах (FreeDV, M17), но не совместим с DMR ETSI по определению.
Как голос идёт через сеть DMRhub
В чистой DMR-сети голос проходит весь путь в одном и том же формате — закодированные AMBE+2-кадры. Это принципиальное отличие от аналогового ретранслятора, который «слышит» и переизлучает звук.
- Вы нажали тангенту — чип в рации закодировал голос в поток AMBE+2-кадров.
- Кадры по радио ушли на MMDVM-хотспот.
- Хотспот завернул их в IP-пакеты (протокол MMDVM/Homebrew) и отправил на сервер-мастер DMRhub.
- Сервер-мастер разослал те же пакеты всем абонентам активной talkgroup.
- Рации получателей раскодировали AMBE+2 обратно в звук.
На всём этом пути никакого транскодинга нет. Сервер-мастер работает как коммутатор: маршрутизирует уже готовые голосовые кадры, не разворачивая их в PCM. Это делает инфраструктуру легковесной — транскодирование не требует ни аппаратных чипов DVSI на сервере, ни значительных вычислительных ресурсов.
Транскодинг: когда он всё же нужен
Проблема возникает на межрежимных шлюзах. D-STAR использует более старый кодек AMBE (без «+2»), C4FM/YSF — технически тот же AMBE+2, но в другой «упаковке» с иной сигнализацией. Если вы хотите связать DMR и D-STAR или DMR и YSF «голосом», шлюз обязан:
- Декодировать AMBE+2-кадры DMR в PCM-аудио;
- Перекодировать PCM обратно в нужный формат другой сети.
Для этого шлюзу нужен либо аппаратный USB-донгл DVSI (AMBE-3000 или аналог), либо лицензированная программная библиотека. Именно поэтому межрежимные рефлекторы — отдельный класс инфраструктуры. В нашей сети, работающей только в стандарте DMR, такого оборудования не требуется.
Качество звука и границы возможного
AMBE+2 звучит лучше своего предшественника AMBE (используемого в D-STAR) благодаря улучшенному алгоритму и встроенному FEC. При уровне BER ниже ~2–3% качество остаётся стабильным и разборчивым. При сильных ошибках вокодер маскирует повреждённые кадры — слышится «буль-буль» или кратковременный провал звука, после чего речь восстанавливается.
Принципиальное ограничение параметрического вокодера: он оптимизирован под человеческую речь. Музыка, свисты, сильные помехи на микрофоне звучат через AMBE+2 узнаваемо «синтетически» — алгоритм моделирует голосовой тракт, а не произвольный звуковой сигнал.
Голос в DMRhub идёт end-to-end без транскодинга
В нашей сети вокодер работает только в рации. Сервер-мастер гоняет уже закодированные AMBE+2-кадры как есть — никакого переперекодирования, никаких чипов DVSI на сервере. Чтобы выйти в эфир, достаточно рации с поддержкой DMR, своего DMR ID и хотспота или ближайшего репитера.
Источники
- DVSI AMBE+2 Vocoder Technology (официальная страница продукта) — dvsinc.com
- ETSI TS 102 361-1: DMR Air Interface protocol / голосовой кадр 216 бит, 3 × 72 бит AMBE+2 — cartoonman.github.io (DMR frame)
- Multi-Band Excitation — Wikipedia (история MBE/IMBE/AMBE/AMBE+2, лицензирование) — en.wikipedia.org
- What are Transcoding Reflectors (Silvercreek ARA) — транскодинг DMR/YSF/D-STAR — w8wky.org