Применительно к встроенному аудио в видеосигнал SDI, всегда имеется в виду цифровое аудио, которое синхронно включается в кадр цифрового видеосигнала SDI. То есть по одному медному кабелю или оптоволокну передается видеосигнал плюс аудиосигнал, синхронизированный с этим видео.
Стандарт SMPTE 299M-2004 определяется, как цифровой аудиосигнал длиной 24 бита и управляющие сигналы включены в зону вспомогательных данных видеокадра в соответствии со стандартом SMPTE 292M.
Аудиоданные AES могут содержать данные PCM или другие (не-PCM), отформатированные в соответствии с SMPTE 337.
Организованные в группы по 4 канала цифрового звука, также с возможностью передачи до 4 групп, то есть максимум 16 каналов (8 пар AES) для частот дискретизации 32 кГц, 44.1 кГц или 48 кГц. При частоте дискретизации 96 кГц возможна передача до 8 каналов. Характеристики цифрового звука всех каналов должны быть одинаковыми (частота дискретизации, фаза дискретизации и синхронизация).
Каждая аудиогруппа имеет уникальный идентификатор. Пакеты аудиоданных внедряются в горизонтальное вспомогательное пространство потока данных Cb/Cr (цветности).
Управляющие пакеты звука (дающие номер информационного кадра, частоту дискретизации, задержку обработки звука, активность или неактивность канала и т.п.) внедряются в горизонтальное вспомогательное пространство потока данных Y (яркость).
Может оказаться, что в конкретной задаче необходимо извлекать звук из сигнала SDI и передавать его отдельно от видео. Это возможно благодаря устройствам деэмбеддера аудио.