Вокодер AMBE: как голос превращается в данные DMR

Категория: ОсновыСложность: ★★☆~9 мин

Нажали тангенту — рация не «записывает» голос как диктофон. Вместо этого специализированный алгоритм — вокодер — за доли секунды строит математическую модель вашей речи и отправляет в эфир крошечный поток данных. На принимающей стороне та же модель разворачивается обратно в звук. Именно поэтому DMR звучит чисто там, где аналоговая FM уже шипит: главный враг цифры — не слабый сигнал как таковой, а ошибки в битах.

Что такое вокодер и при чём тут MBE

Слово вокодер (vocoder) — сокращение от voice coder. В отличие от аудиокодеков (MP3, AAC), которые «фотографируют» сигнал, вокодер строит параметрическую модель речеобразования: как работают голосовые связки, как форма ротовой полости меняет тембр. Передавать эти параметры гораздо дешевле, чем сам звук.

AMBE (Advanced Multi-Band Excitation) — семейство вокодеров компании DVSI (Digital Voice Systems, Inc.), построенных на методе MBE (Multi-Band Excitation). Метод разделяет речевой сигнал на гармонические полосы и по каждой оценивает, насколько она «вокализована» (звонкая) или «шумовая» (шипящая). Это позволяет сохранить разборчивость речи при очень низких битрейтах.

AMBE+2: версия для DMR

Стандарт ETSI для DMR (TS 102 361-1) закрепил в качестве голосового кодека AMBE+2 — последнее на момент принятия стандарта поколение семейства. Ключевые числа:

Почему 3 600, а не 2 450? FEC добавляет ~47% избыточности. При пакетных ошибках в эфире это позволяет восстановить кадр без переспроса. Если ошибок слишком много — кадр «маскируется» интерполяцией по соседним; слышится характерный «пузырящийся» артефакт, а не белый шум аналоговой FM.

Где физически живёт вокодер

В профессиональных и любительских рациях AMBE+2 реализован одним из двух способов:

В обоих случаях вокодер — часть рации, а не сети. Серверная инфраструктура видит уже закодированные кадры.

Задержка кодирования Один AMBE-кадр = 20 мс. Типичная сквозная задержка в DMR-хотспоте с сервером — порядка 100–300 мс. Это сравнимо с IP-телефонией и незаметно в обычном разговоре по тангенте.

Патентованный алгоритм: что это значит на практике

AMBE/AMBE+2 — патентованная технология DVSI. Производитель рации платит DVSI лицензионный сбор. Для конечного пользователя это означает несколько важных следствий:

Важно Программные реализации AMBE для личного использования существуют «в серой зоне» патентного права. Коммерческое использование без лицензии DVSI незаконно. В любительской радиосвязи ситуация варьируется по юрисдикциям.

Как голос идёт через сеть DMRhub

В чистой DMR-сети голос проходит весь путь в одном и том же формате — закодированные AMBE+2-кадры. Это принципиальное отличие от аналогового ретранслятора, который «слышит» и переизлучает звук.

  1. Вы нажали тангенту — чип в рации закодировал голос в поток AMBE+2-кадров.
  2. Кадры по радио ушли на MMDVM-хотспот.
  3. Хотспот завернул их в IP-пакеты (протокол MMDVM/Homebrew) и отправил на сервер-мастер DMRhub.
  4. Сервер-мастер разослал те же пакеты всем абонентам активной talkgroup.
  5. Рации получателей раскодировали AMBE+2 обратно в звук.

На всём этом пути никакого транскодинга нет. Сервер-мастер работает как коммутатор: маршрутизирует уже готовые голосовые кадры, не разворачивая их в PCM. Это делает инфраструктуру легковесной — транскодирование не требует ни аппаратных чипов DVSI на сервере, ни значительных вычислительных ресурсов.

Транскодинг: когда он всё же нужен

Проблема возникает на межрежимных шлюзах. D-STAR использует более старый кодек AMBE (без «+2»), C4FM/YSF — технически тот же AMBE+2, но в другой «упаковке» с иной сигнализацией. Если вы хотите связать DMR и D-STAR или DMR и YSF «голосом», шлюз обязан:

Для этого шлюзу нужен либо аппаратный USB-донгл DVSI (AMBE-3000 или аналог), либо лицензированная программная библиотека. Именно поэтому межрежимные рефлекторы — отдельный класс инфраструктуры. В нашей сети, работающей только в стандарте DMR, такого оборудования не требуется.

C4FM и AMBE+2 — «родственники», но не совместимы Motorola, Hytera (DMR) и Yaesu (C4FM/YSF) используют один и тот же вокодер AMBE+2 в своих системах. Но DMR и C4FM имеют разные протоколы модуляции, фреймирования и сигнализации. Прямой «нативный» приём одного на другом невозможен без транскодинга.

Качество звука и границы возможного

AMBE+2 звучит лучше своего предшественника AMBE (используемого в D-STAR) благодаря улучшенному алгоритму и встроенному FEC. При уровне BER ниже ~2–3% качество остаётся стабильным и разборчивым. При сильных ошибках вокодер маскирует повреждённые кадры — слышится «буль-буль» или кратковременный провал звука, после чего речь восстанавливается.

Принципиальное ограничение параметрического вокодера: он оптимизирован под человеческую речь. Музыка, свисты, сильные помехи на микрофоне звучат через AMBE+2 узнаваемо «синтетически» — алгоритм моделирует голосовой тракт, а не произвольный звуковой сигнал.

Голос в DMRhub идёт end-to-end без транскодинга

В нашей сети вокодер работает только в рации. Сервер-мастер гоняет уже закодированные AMBE+2-кадры как есть — никакого переперекодирования, никаких чипов DVSI на сервере. Чтобы выйти в эфир, достаточно рации с поддержкой DMR, своего DMR ID и хотспота или ближайшего репитера.

Источники

  1. DVSI AMBE+2 Vocoder Technology (официальная страница продукта) — dvsinc.com
  2. ETSI TS 102 361-1: DMR Air Interface protocol / голосовой кадр 216 бит, 3 × 72 бит AMBE+2 — cartoonman.github.io (DMR frame)
  3. Multi-Band Excitation — Wikipedia (история MBE/IMBE/AMBE/AMBE+2, лицензирование) — en.wikipedia.org
  4. What are Transcoding Reflectors (Silvercreek ARA) — транскодинг DMR/YSF/D-STAR — w8wky.org