И вновь о динамическом диапазоне / Audiophile's Software

Не так давно мне попался довольно качественный HDCD релиз альбома «Mark Knopfler — Sailing To Philadelphia». Впервые я отметил столь низкий уровень фонового шума и динамический диапазон для музыки с живыми инструментами и голосом. Результат сканирования всего альбома гласил:

Left Right
Peak Amplitude: 0,00 dB 0,00 dB
True Peak Amplitude: 0,64 dBTP 0,58 dBTP
Maximum Sample Value: 8388607 8387420
Minimum Sample Value: -8388608 -8388608
Possibly Clipped Samples: 3 1
Total RMS Amplitude: -15,12 dB -15,20 dB
Maximum RMS Amplitude: -5,75 dB -5,80 dB
Minimum RMS Amplitude: -120,64 dB -123,81 dB
Average RMS Amplitude: -18,90 dB -19,01 dB
DC Offset: 0,00 % 0,00 %
Measured Bit Depth: 24 24
Dynamic Range: 114,89 dB 118,02 dB
Dynamic Range Used: 83,15 dB 82,95 dB
Loudness: -13,48 dB -12,87 dB
Perceived Loudness: -10,61 dB -10,63 dB
ITU-R BS.1770-2 Loudness: -12,72 LUFS

0dB = FS Square Wave
Using RMS Window of 50,00 ms
Account for DC = true

Краткий ликбез

Динамический диапазон — это разница (или соотношение) между самым громким и самым тихим звуком, выраженная в децибелах. Для определения динамического диапазона используют RMS значения, т.е. Root Mean Square — среднеквадратичные, или же, как принято у нас — «действующие» или «эффективные». Действующее значение выбирается потому, что именно оно (в отличие от пикового) напрямую связано с уровнем звукового давления, и, как следствие, воспринимаемой громкости.

Для анализа вышеуказанных характеристик был использован Adobe Audition. В данном случае алгоритм анализа ДД примерно такой: всё аудио разбивается на небольшие участки, именуемые окнами (в данном случае их размер равен 50 мс), затем для каждого такого участка вычисляется среднеквадратичное значение (путем интегрирования). Далее полученное значение соотносится с одним из следующих: 1. Среднеквадратичное значение для синусоиды с максимальной амплитудой и такой же продолжительностью. 2. Меандр с максимальной амплитудой и такой же продолжительностью. Как известно, меандр имеет максимально возможное значение RMS за период (т.к. модуль его амплитуды в любой момент равен максимуму), синусоида же имеет коэффициент 1/(корень из 2), т.е. 0.707 от максимального (или же пикового) значения. Если вы еще раз взглянете на отчет, то увидите, что там за 0 dB RMS взят меандр (square wave). Таким образом, полученные децибелы среднеквадратичного значения имеют опорный уровень (0 dBFS) равный среднеквадратичному значению для меандра.

Также надо отметить, что при расчете RMS может учитываться или не учитываться постоянная составляющая (в некоторых случаях колебания происходят не относительно нулевого значения, а относительно некоторой константы, которая и равна постоянной составляющей). В нашем случае учет постоянной составляющей включен.

После получения RMS значения для каждого окна производится поиск наименьшего и наибольшего значений. Разница между двумя этими значениями — и есть динамический диапазон.

Кроме того, Audition определяет параметр «Dynamic Range Used», который рассчитывается без учета тишины в начале и конце трека, а также без учета других продолжительных участков с тишиной внутри дорожки. Собственно, этот параметр и является наиболее информативным и важным при анализе динамического диапазона.

DVD-Audio

Так вот, сегодня я наконец заполучил DVD-Audio релиз того самого альбома, о котором писал выше. Результаты меня удивили еще больше. Многоканальная дорожка содержала записи с динамическим диапазоном более 100 дБ, хотя значения для отдельных каналов были довольно разными (кстати говоря, Audition показал для фронтальных каналов актуальную разрядность 24 бита, а для остальных — 20). Я решил произвести более детальный анализ записей: вручную выполнил сведение каналов в стерео (с помощью Channel Mixer в foobar2000), а затем проанализировал динамический диапазон 5.1 записи, стерео даунмикса с DVD диска и моего собственного даунмикса.

Результаты для каждого трека/канала приведены в таблице Excel.

Интересно, что динамический диапазон даунмиксов получились совершенно различным (разной была и громкость — у моего даунмикса она была ниже на несколько децибел). Но, так или иначе, например, для 4-го трека во всех трех случаях отмечается широкий динамический диапазон, более 90 дБ.

Но это что касается отдельных параметров. Наиболее же информативной является гистограмма громкости. Она показывает распределение громкости по частоте появления. Т.е. это значения RMS для всех окон, представленные в виде диаграммы, где по вертикали частота появления, по горизонтали уровень громкости. Таим образом можно видеть, какой уровень громкости преобладает в дорожке, насколько велика суммарная продолжительность тихих участков и т.д.

Например, вот гистограммы громкости для моего и DVD стерео даунмикса четвертого трека (правый канал), соответственно:

Высокая частота для громкости с уровнем около ~110 говорит о том, что это скорей всего уровень шумов звукозаписывающего оборудования. В общем же, наиболее интересными являются дорожки с довольно высоким процентом тихих фрагментов. Например, вот диаграмма для моего микса 7-го трека:

Подобный материал гипотетически может помочь выявить различия между 24- и 16-битным аудио. Именно с целью определить возможность выявления таких различий, а также вообще резонность использования 24-битного формата, я искал столь качественные аудиозаписи.

О результатах моих проверок я сообщу в следующих записях.

Добавлено: судя по всему, широкий динамический диапазон — лишь результат обработки записи. Т.е. тихие участки являются либо участками работы шумоподавления, либо фрагментами затухающих звуков (fade-in/fade-out). Реальных же продолжительных во времени звуков со столь низким уровнем (<80 dBFS) записи не содержат, потому отличить их от 16-битного варианта на слух невозможно.

Информация от спонсора

PCforums: компьютерный форум. Здесь Вы найдёте интересные материалы и обсуждения на компьютерную и околокомпьютерную тематику а также получите от завсягдатаев форума ответы на любые интересующие Вас вопросы.

Добавлять комментарии могут только зарегистрированные пользователи. [ Регистрация | Вход ]

Порядок вывода комментариев:

Спам

[2] Taras (24 Июня 2014 15:18)

Вот такой комментарий есть на рутрекере:

Цитата

Именно, хай реза тут нет. Альбом был записан в 1999 году на студийный DAT SONY PCM 3348 16 bit/48 kHz. После сведения был закодирован в HDCD -
т е по факту 15+1 (служебный) бит/44.1. Благодаря такой технологии - CD
Sailing To Philadelphia - один из самых плохо звучащих альбомов МК.
Теперь по поводу DVD-A: стеродорога 24/88,2 - чистая халтура - простой
апсемплинг HDCD мастера. В ПОМОЙКУ. А вот в основе MLP 5.1 был студийный
оригинал 16/48 который в 2001 году и раскидали на 6 каналов. 24 бита
конечно тут от лукавого. Если даже у вас нет возможности слушать DVD-A в
мультиканале или мешает вода - можете сграбить треки (DVDAExplorer) и
сделать downmix на 2 канала. Слушать на компе, или подходящем плеере
типа Sqeezebox .можете смастерить ДВД видео с дорогой 24/48, можете даже
конвертнуть полученные wav-ки в CD 16/44,1 и поверьте - это будет
звучать лучше HDCD дряни.
Кстати именно этот DVD-A (промо экземпляр 2001 года) был тестовым для демонстрации эффективности водяных знаков.

[1] sergbill (22 Января 2014 14:18)

результатов ждём.