В качестве продолжения цикла статей об экзотических алгоритмах кодирования и носителях аудиоданных (уже можно почитать про DVD-Audio, HDCD и DTS/DTS-CD) хочу рассказать о таком интересном стандарте, как SACD.
SACD диски. Формат DSD
Super Audio Compact Disc — как и Audio CD — результат сотрудничества компаний Sony и Philips. Разработка стандарта была завершена в 1999 году — через 17 лет после выхода Red Book (CDDA).
SACD представляет собой оптический диск с высокой плотностью данных, по физическим размерам и объему данных соответствующий диску DVD. Также у DVD и SACD совпадает длина волны считывающего лазера — 650 нм против 780 у CDDA (именно увеличение частоты позволило увеличить плотность питов и, как следствие, объем носителя). Одной из отличительных особенностей SACD является использование золота в качестве отражающего слоя (вместо алюминия). Это увеличивает отражающую способность, долговечность дисков, но также обуславливает их высокую стоимость.
Особый интерес представляет собой содержимое диска — данные в формате Direct Stream Digital. DSD — это однобитный поток с частотой дискретизации достигающей 2822.4 кГц. По сути это тот самый поток, который получается на выходе сигма-дельта АЦП.
Особенностью сигма-дельта АЦП является кодирование не абсолютного значения уровня сигнала в конкретный момент времени, а его приращения.
Схема сигма-дельта АЦП
На выходе этого АЦП мы получаем нули и единицы, следующие с очень высокой частотой. Причем уровень сигнала пропорционален сумме закодированных за единицу времени приращений (1 означает «+1», а 0 — «-1»).
Подробнее об алгоритме работы данного АЦП можно почитать здесь. Вкратце — такой способ квантования позволяет получить широкий динамический диапазон (около 120 дБ) и очень низкий уровень шумов в слышимом диапазоне частот — за счет формовки шума (noise shaping) они вытесняются в сверрхзвуковую область и могут быть легко отфильтрованы. Также, благодаря многократному превышению частоты Найквиста, такой способ помогает избежать фазовых задержек в области верхней граничной частоты (однако степень влияния этого фактора на качество звучания точно не установлено) и уменьшить влияние джиттера.
Итак, главным преимуществом SACD является отсутствие необходимости в так называемой децимации — понижении частоты дискретизации. Так как на самом деле это промежуточное преобразование происходит в случае со всеми остальными форматами аудио (CDDA, DVD-A). Т.е. при оцифровке студийной записи на выходе АЦП мы фактически получаем DSD поток, затем его приходится преобразовывать в PCM с повышенной разрядностью, но более низкой частотой дискретизации, что уже представляет собой алгоритм с потерями. И — что самое интересное — при воспроизведении, непосредственно перед цифро-аналоговым преобразованием (а, как известно, в аудиотехнике используется именно дельта-сигма ЦАП), частоту дискретизации всё равно придется повышать, выполняя преобразование в тот самый 1-битный DSD формат, в котором данные были сняты с АЦП.
Таким образом SACD позволяет хранить аудио в «первозданном» виде, и в таком же виде подавать их при воспроизведении на ЦАП. Отсутствие промежуточной децимации упрощает схемотехнику устройств и позволяет добиться более высоких показателей качества.
Напоследок хочу упомянуть о различных вариациях стандартов DSD и SACD. Существуют реализации с разной степенью оверсемплинга. Они обозначаются цифрой, равной отношению частоты дискретизации DSD к частоте дискретизации CDDA (44.1 kHz). SACD использует формат DSD64 (2822.4 kHz/ 44.1 kHz = 64), также существуют DSD128/256/512/768, поддерживаемые многими ЦАП.
SACD поддерживает конфигурацию каналов 2.0 и 5.1, причем на одном SACD могут содержаться две дорожки — стерео и многоканальная. Многоканальная дорожка обязательно представляется в сжатом виде (сжатие без потерь; для стерео — опционально), так называемом DST формате (Direct Stream Transfer), который обеспечивает сжатие в 2-3 раза.
Так же, как и DVD, SACD бывают одно- и двухслойные. На однослойных SACD может содержаться CDDA слой для обратной совместимости с проигрывателями без поддержки технологии SACD (такие диски называются гибридными).
Защита SACD от копирования. Распространение аудио в формате DSD
Все SACD диски обладают специальной защитой (на физическом уровне), которая позволяет считывать SACD слой только лицензированным производителем устройствам, которые оснащены специальным ключом. Тем не менее, в интернете можно найти раздачи SACD рипов. Снятие рипов выполняется с помощью PlayStation 3 и специальной программы SACD Ripper для ПК. Рип представляет собой так называемый SACD-R образ (как правило в формате ISO). Этот образ можно записать (тем же ImgBurn, например) на DVD диск и далее слушать на стационарном SACD проигрывателе.
Таким образом мы видим, что технология SACD не включает в себя ничего принципиально нового — по сути это поток данных с АЦП, записанный на носитель вроде DVD. Весомое различие между SACD и DVD диском (кроме защиты от копирования) заключается лишь в размере сектора — 2064 вместо 2048 байт. Похоже, что этот трюк был придуман в коммерческих целях, и во многом именно поэтому ни один оптический привод для ПК не читает SACD диски.
Также надо упомянуть о специальных форматах-контейнерах DSDIFF (DSD Interchange File Format) и DSF (DSD Storage Facility). Файловый формат DSDIFF был разработан в 2000 году и предназначен для записи, редактирования и мастеринга аудио непосредственно в DSD представлении. Формат DSF является частью разработанной Sony спецификации DSD Disc Format и используется для создания DSD-дисков. DSD-диск представляет собой DVD или Blue-ray носитель с файлами формата DSF. Данный формат является открытым, однако не обладает поддержкой многоканальности.
Как воспроизвести SACD?
Само собой, наиболее качественное воспроизведение DSD аудио достигается при использовании оборудования/ПО, позволяющего передать 1-битный DSD поток непосредственно на ЦАП (прежде всего это аппаратные SACD плееры). Что касается ПК — к сожалению, большинство аудиокарт не обладают поддержкой передачи DSD на ЦАП (DSD passthrough, если так можно выразиться). Обычно поддержку DSD input имеют лишь дорогостоящие внешние ЦАП вроде ASUS Essence III. Таким образом на компьютере мы вынуждены использовать преобразование в PCM.
Что касается самого чтения SACD — воспроизвести SACD диск на приводе ПК, как я уже сказал, невозможно. Потому в дальнейшем я буду рассматривать исключительно воспроизведение образов (SACD-R, DSD-Disc).
Для воспроизведения образа (имеющего формат ISO) нам понадобится плеер foobar2000 с установленным плагином SACD Decoder.
Настройки SACD декодера
В настройках кодера можно задать целевую частоту дискретизации и алгоритм преобразования DSD в PCM (ИКМ). К сожалению, найти достоверной информации по поводу алгоритмов мне не удалось. Но кое-что я смог выяснить сам. Multistage (fixed point) выполняет расчеты с фиксированной точкой, Multistage (flkoating-point) является SSE оптимизированным алгоритмом (прирост скорости на моём i3 составил всего 10-20%) и использует плавающую точку. Direct метод является самым медленным (на 30% медленнее Multistage fixed), и выполняет фильтрацию частот выше 30 кГц. Installable FIR режим позволяет загрузить одну из приложенных к плагину предустановок ФНЧ, давая таким образом возможность выбирать граничную частоту. Double precision обозначает плавающую точку с двойной точностью (64 бита), однако foobar2000 поддерживает лишь 32-битный формат, и использование этого режима не имеет смысла (результаты на выходе идентичны).
Спектр аудио 192 кГц, полученного алгоритмом Multistage (fixed point). На графике виден высокий уровень шума в сверхзвуковом диапазоне, обусловленный нойз шейпингом
Лично я советую выбрать режим Direct (Floating-Point, 30kHz LF) и максимальную частоту дискретизации, а в DSP (обязательно в самое начало цепочки) поставить SoX ресемплер до опорной частоты звуковой карты (её, в свою очередь, установить максимальной). Касаемо настроек звука — рекомендую почитать мою статью про качественный вывод звука.
Также настройки позволяют установить увеличение уровня громкости. Большинство SACD имеет пиковый уровень менее -6 dBFS (0.5 от максимума), потому его можно установить в +6 dBFS. Чтобы убедиться в отсутствии клиппинга можно выполнить анализ результирующего пика с помощью ReplayGain сканера (в контекстном меню foobar2000). Если пик превысит 1.0, усиление следует занизить.
Имеется и настройка для выбора предпочтительной звуковой дорожки — стерео или многоканальной. Выберите None, чтобы в плейлист загружались все дорожки.
SACD плагин для foobar2000 также умеет выводить аудио в режиме DSD (через ASIO 2.0 интерфейс). Специально в комплекте с плагином идет ASIO Proxy, который позволяет выбирать различные форматы DSD и специальные сигнатуры. Так как количество устройств с поддержкой DSD крайне невелико, да и к тому же я таким устройством не располагаю, настройки DSD я описывать не буду. Те же счастливчики, кто имеет в своём расположения такие ЦАП, могут почитать о настройках вывода здесь.
Воспроизведение SACD-R в foobar2000. В плейлист загружены сжатые в DST стерео и 5.1 дорожки (битрейт отображается для декодированного DSD). На спектрограмме виден ВЧ шум (частотный диапазон — 96 кГц)
Конвертирование SACD
Конвертирование SACD и DSD ничем не отличается от преобразования того же Hi-Res рипа 24/192 или т.п., единственное что — как и перед воспроизведением, предварительно необходимо настроить декодер. Всё остальное уже описано в статье Преобразование аудио высокой разрядности в 16 бит/44.1 кГц стерео.
|