Разделы

Поиск по сайту

Популярное

Персональная настройка

Настройка звука онлайн (foobar2000, драйвера, Windows), создание персональных сборок foobar2000.

Контакты

Случайный опрос

Как Вы впервые попали на этот сайт?

Нашли ссылку на форуме

Перешли с другого ресурса

Нашли в поисковой системе

Рассказали друзья, знакомые

Перешли с каталога/рейтинга сайтов

Нашли ссылку в архиве с программой

Увидели рекламу

[ Результаты · Все опросы ]

Всего ответов: 849

Полезный софт

Похожие проекты

Сейчас на сайте

Онлайн всего: 18

Гостей: 16

Пользователей: 2

Donscoy, Audiophile

Главная » Статьи » Авторские статьи

О формате SACD/DSD. Описание технологии, воспроизведение, конвертирование

	25 Ноября 2013, 12:16

В качестве продолжения цикла статей об экзотических алгоритмах кодирования и носителях аудиоданных (уже можно почитать про DVD-Audio, HDCD и DTS/DTS-CD) хочу рассказать о таком интересном стандарте, как SACD.

SACD диски. Формат DSD

Super Audio Compact Disc — как и Audio CD — результат сотрудничества компаний Sony и Philips. Разработка стандарта была завершена в 1999 году — через 17 лет после выхода Red Book (CDDA).

SACD представляет собой оптический диск с высокой плотностью данных, по физическим размерам и объему данных соответствующий диску DVD. Также у DVD и SACD совпадает длина волны считывающего лазера — 650 нм против 780 у CDDA (именно увеличение частоты позволило увеличить плотность питов и, как следствие, объем носителя). Одной из отличительных особенностей SACD является использование золота в качестве отражающего слоя (вместо алюминия). Это увеличивает отражающую способность, долговечность дисков, но также обуславливает их высокую стоимость.

Особый интерес представляет собой содержимое диска — данные в формате Direct Stream Digital. DSD — это однобитный поток с частотой дискретизации достигающей 2822.4 кГц. По сути это тот самый поток, который получается на выходе сигма-дельта АЦП.

Особенностью сигма-дельта АЦП является кодирование не абсолютного значения уровня сигнала в конкретный момент времени, а его приращения.

Схема сигма-дельта АЦП

На выходе этого АЦП мы получаем нули и единицы, следующие с очень высокой частотой. Причем уровень сигнала пропорционален сумме закодированных за единицу времени приращений (1 означает «+1», а 0 — «-1»).

Подробнее об алгоритме работы данного АЦП можно почитать здесь. Вкратце — такой способ квантования позволяет получить широкий динамический диапазон (около 120 дБ) и очень низкий уровень шумов в слышимом диапазоне частот — за счет формовки шума (noise shaping) они вытесняются в сверрхзвуковую область и могут быть легко отфильтрованы. Также, благодаря многократному превышению частоты Найквиста, такой способ помогает избежать фазовых задержек в области верхней граничной частоты (однако степень влияния этого фактора на качество звучания точно не установлено) и уменьшить влияние джиттера.

Итак, главным преимуществом SACD является отсутствие необходимости в так называемой децимации — понижении частоты дискретизации. Так как на самом деле это промежуточное преобразование происходит в случае со всеми остальными форматами аудио (CDDA, DVD-A). Т.е. при оцифровке студийной записи на выходе АЦП мы фактически получаем DSD поток, затем его приходится преобразовывать в PCM с повышенной разрядностью, но более низкой частотой дискретизации, что уже представляет собой алгоритм с потерями. И — что самое интересное — при воспроизведении, непосредственно перед цифро-аналоговым преобразованием (а, как известно, в аудиотехнике используется именно дельта-сигма ЦАП), частоту дискретизации всё равно придется повышать, выполняя преобразование в тот самый 1-битный DSD формат, в котором данные были сняты с АЦП.

Таким образом SACD позволяет хранить аудио в «первозданном» виде, и в таком же виде подавать их при воспроизведении на ЦАП. Отсутствие промежуточной децимации упрощает схемотехнику устройств и позволяет добиться более высоких показателей качества.

Напоследок хочу упомянуть о различных вариациях стандартов DSD и SACD. Существуют реализации с разной степенью оверсемплинга. Они обозначаются цифрой, равной отношению частоты дискретизации DSD к частоте дискретизации CDDA (44.1 kHz). SACD использует формат DSD64 (2822.4 kHz/ 44.1 kHz = 64), также существуют DSD128/256/512/768, поддерживаемые многими ЦАП.

SACD поддерживает конфигурацию каналов 2.0 и 5.1, причем на одном SACD могут содержаться две дорожки — стерео и многоканальная. Многоканальная дорожка обязательно представляется в сжатом виде (сжатие без потерь; для стерео — опционально), так называемом DST формате (Direct Stream Transfer), который обеспечивает сжатие в 2-3 раза.

Так же, как и DVD, SACD бывают одно- и двухслойные. На однослойных SACD может содержаться CDDA слой для обратной совместимости с проигрывателями без поддержки технологии SACD (такие диски называются гибридными).

Защита SACD от копирования. Распространение аудио в формате DSD

Все SACD диски обладают специальной защитой (на физическом уровне), которая позволяет считывать SACD слой только лицензированным производителем устройствам, которые оснащены специальным ключом. Тем не менее, в интернете можно найти раздачи SACD рипов. Снятие рипов выполняется с помощью PlayStation 3 и специальной программы SACD Ripper для ПК. Рип представляет собой так называемый SACD-R образ (как правило в формате ISO). Этот образ можно записать (тем же ImgBurn, например) на DVD диск и далее слушать на стационарном SACD проигрывателе.

Таким образом мы видим, что технология SACD не включает в себя ничего принципиально нового — по сути это поток данных с АЦП, записанный на носитель вроде DVD. Весомое различие между SACD и DVD диском (кроме защиты от копирования) заключается лишь в размере сектора — 2064 вместо 2048 байт. Похоже, что этот трюк был придуман в коммерческих целях, и во многом именно поэтому ни один оптический привод для ПК не читает SACD диски.

Также надо упомянуть о специальных форматах-контейнерах DSDIFF (DSD Interchange File Format) и DSF (DSD Storage Facility). Файловый формат DSDIFF был разработан в 2000 году и предназначен для записи, редактирования и мастеринга аудио непосредственно в DSD представлении. Формат DSF является частью разработанной Sony спецификации DSD Disc Format и используется для создания DSD-дисков. DSD-диск представляет собой DVD или Blue-ray носитель с файлами формата DSF. Данный формат является открытым, однако не обладает поддержкой многоканальности.

Как воспроизвести SACD?

Само собой, наиболее качественное воспроизведение DSD аудио достигается при использовании оборудования/ПО, позволяющего передать 1-битный DSD поток непосредственно на ЦАП (прежде всего это аппаратные SACD плееры). Что касается ПК — к сожалению, большинство аудиокарт не обладают поддержкой передачи DSD на ЦАП (DSD passthrough, если так можно выразиться). Обычно поддержку DSD input имеют лишь дорогостоящие внешние ЦАП вроде ASUS Essence III. Таким образом на компьютере мы вынуждены использовать преобразование в PCM.

Что касается самого чтения SACD — воспроизвести SACD диск на приводе ПК, как я уже сказал, невозможно. Потому в дальнейшем я буду рассматривать исключительно воспроизведение образов (SACD-R, DSD-Disc).

Для воспроизведения образа (имеющего формат ISO) нам понадобится плеер foobar2000 с установленным плагином SACD Decoder.

Настройки SACD декодера

В настройках кодера можно задать целевую частоту дискретизации и алгоритм преобразования DSD в PCM (ИКМ). К сожалению, найти достоверной информации по поводу алгоритмов мне не удалось. Но кое-что я смог выяснить сам. Multistage (fixed point) выполняет расчеты с фиксированной точкой, Multistage (flkoating-point) является SSE оптимизированным алгоритмом (прирост скорости на моём i3 составил всего 10-20%) и использует плавающую точку. Direct метод является самым медленным (на 30% медленнее Multistage fixed), и выполняет фильтрацию частот выше 30 кГц. Installable FIR режим позволяет загрузить одну из приложенных к плагину предустановок ФНЧ, давая таким образом возможность выбирать граничную частоту. Double precision обозначает плавающую точку с двойной точностью (64 бита), однако foobar2000 поддерживает лишь 32-битный формат, и использование этого режима не имеет смысла (результаты на выходе идентичны).

Спектр аудио 192 кГц, полученного алгоритмом Multistage (fixed point). На графике виден высокий уровень шума в сверхзвуковом диапазоне, обусловленный нойз шейпингом

Лично я советую выбрать режим Direct (Floating-Point, 30kHz LF) и максимальную частоту дискретизации, а в DSP (обязательно в самое начало цепочки) поставить SoX ресемплер до опорной частоты звуковой карты (её, в свою очередь, установить максимальной). Касаемо настроек звука — рекомендую почитать мою статью про качественный вывод звука.

Также настройки позволяют установить увеличение уровня громкости. Большинство SACD имеет пиковый уровень менее -6 dBFS (0.5 от максимума), потому его можно установить в +6 dBFS. Чтобы убедиться в отсутствии клиппинга можно выполнить анализ результирующего пика с помощью ReplayGain сканера (в контекстном меню foobar2000). Если пик превысит 1.0, усиление следует занизить.

Имеется и настройка для выбора предпочтительной звуковой дорожки — стерео или многоканальной. Выберите None, чтобы в плейлист загружались все дорожки.

SACD плагин для foobar2000 также умеет выводить аудио в режиме DSD (через ASIO 2.0 интерфейс). Специально в комплекте с плагином идет ASIO Proxy, который позволяет выбирать различные форматы DSD и специальные сигнатуры. Так как количество устройств с поддержкой DSD крайне невелико, да и к тому же я таким устройством не располагаю, настройки DSD я описывать не буду. Те же счастливчики, кто имеет в своём расположения такие ЦАП, могут почитать о настройках вывода здесь.

Воспроизведение SACD-R в foobar2000. В плейлист загружены сжатые в DST стерео и 5.1 дорожки (битрейт отображается для декодированного DSD). На спектрограмме виден ВЧ шум (частотный диапазон — 96 кГц)

Конвертирование SACD

Конвертирование SACD и DSD ничем не отличается от преобразования того же Hi-Res рипа 24/192 или т.п., единственное что — как и перед воспроизведением, предварительно необходимо настроить декодер. Всё остальное уже описано в статье Преобразование аудио высокой разрядности в 16 бит/44.1 кГц стерео.

Категория: Авторские статьи | Автор:Taras Kovrijenko | Добавил: Audiophile (2013-11-25T12:16)

Просмотров: 16449 | Комментарии: 5 | Рейтинг: 5.0/5, голосов: 1

Всего комментариев: 5

Порядок вывода комментариев:

Спам

[5] Rollinnn (02 Ноября 2014 20:17)

Кстати, конвертировал тут один SACD и заметил, что при конвертации все методы, кроме Multistage fixed, могут давать слышимый щелчок на стыке треков. Вот этот. Особенно заметный щелчок получается между Double Agent и Leave That Thing Alone.

Спам

[4] IronAngel72 (13 Января 2014 15:33)

Есть ли возможность прямого преобразования DSD64 в DSD128 ?

Спам

[1] Rollinnn (26 Ноября 2013 17:13)

Цитата Audiophile

Лично я советую выбрать режим Direct (Floating-Point, 30kHz LF)

Цитата

-can anyone explain the difference between ASIO driver modes (DSD / PCM)
and DSD2PCM modes (Multistage fixed / Multistage floating point / Direct
floating) and which modes give better quality than the others?

-Fixedpoint algorithm has higher precision among three.

http://sourceforge.net/p....7c

Цитата

-Multistage is better than direct
Double precision is better than floating point and fixed point
Correct?

-Can't say anything sound about floating->fixed->double. Speculatively, should
be in this way.

http://sourceforge.net/p....e8

Спам

[2] Audiophile (26 Ноября 2013 19:23)

Очень мутно, даже так. Я читал уже подобное. Но фубар работает с форматом 32-bit float, потому double precision (64-bit float) автоматом режет до 32, и толку нет (сравнивал непосредственно выходные файлы - отличия в самом последнем бите, на уровне -144 дБ, т.е. фактически одно и то же). Почему fixed лучше float - непонятно совершенно. Ну может fixed - это i32v32, но всё равно у фубара всё в 32-bit float и таким образом режет fixed до 24 значащих бит.

Почему режимы называются multistage и direct - просто загадка. Ведь фактически разница лишь в присутствии или отсутствии ФНЧ, В общем, муторно всё это...

Спам

[3] Rollinnn (27 Ноября 2013 18:16)

Ну это ж сам автор плагина так объясняет, так что более ясные ответы вряд ли от кого-то можно получить.

Кстати, про 24 fixed и 32 float

Цитата

The 32-bit file includes an exponent that scales the value depending on it’s amplitude. So smaller numbers are recorded more accurately, and
larger numbers can be recorded without clipping, as you say. So even
though there are only 24 bits used, it is effectively a higher bit-depth
number.

http://productionadvice.co.uk/when-to....t-15401 Дядька - звукоинженер, не "аудиофил".

Собственно, если в Soundforge сгенерировать, например, файл с тоном 1кГц на -90 дБ в
24 fixed и в 32 float, а потом посмотреть спектрограмму в окне
Frequency Analysis в Audition, то разница видна будет. На слух-то, естественно, никто ничего не заметит.