Разделы

Поиск по сайту

Популярное

Персональная настройка

Настройка звука онлайн (foobar2000, драйвера, Windows), создание персональных сборок foobar2000.

Контакты

Случайный опрос

C помощью чего Вы предпочитаете воспроизводить музыку на компьютере?

Наушники

Акустическая система 2.0 (Stereo)

2.1 (Stereo + Subwoofer)

4.0 (Quadro)

4.1

5.1

7.1

Mono

Нестандартная конфигурация

[ Результаты · Все опросы ]

Всего ответов: 2763

Полезный софт

Похожие проекты

Сейчас на сайте

Онлайн всего: 17

Гостей: 15

Пользователей: 2

BSV, Kazanec

Главная » Статьи » Теория

Наиболее распространенные заблуждения на тему цифрового звука

	10 Декабря 2013, 13:16

Примечание: для лучшего понимания нижеизложенного текста очень рекомендую ознакомиться с основами цифрового звука.

S: Чем больше битрейт, тем качественнее трек.

R: Это далеко не всегда так. Для начала напомню, что такое битрейт (bitrate, а не bitraid). Фактически это скорость потока данных в килобитах в секунду при воспроизведении. Т. е., если мы возьмем размер трека в килобитах и разделим на его продолжительность в секундах, получим его битрейт — т. н. file-based bitrate (FBR), обычно он не слишком отличается от битрейта аудиопотока (причиной различий является наличие в треке метаданных — тегов, «вшитых» изображений и т. п.).

Теперь возьмем пример: битрейт несжатого PCM аудио, записанного на обычном Audio CD, рассчитывается следующим образом: 2 (канала) * 16 (бит на каждый семпл) * 44100 (семплов в секунду) = 1411200 (бит/с) = 1411.2 кбит/с. А теперь возьмем и сожмем трек любым lossless кодеком («lossless» = «беспотерьный», т. е. такой, который не приводит к потере каких-либо данных), например кодеком FLAC. В результате мы получим битрейт ниже исходного, но качество при этом останется неизменным — вот вам и первое опровержение. Сюда еще кое-что стоит добавить. Битрейт на выходе при lossless сжатии может получиться самый разный (но, как правило он меньше, чем у несжатого аудио) — зависит это от сложности сжимаемого сигнала, а точнее от избыточности данных. Таким образом, более простые сигналы будут сжиматься лучше (т. е. имеем меньший размер файла при такой же продолжительности => меньший битрейт), а более сложные — хуже. Именно поэтому классическая музыка в lossless имеет меньший битрейт, чем, скажем, рок. Но надо подчеркнуть, что битрейт тут ни в коем случае не является показателем качества звукового материала.

Теперь поговорим о lossy сжатии (с потерями). Первым делом надо понимать, что существует множество разных кодеров и форматов, и даже в пределах одного формата качество кодирования у разных кодеров может отличаться (например, Nero AAC кодирует намного качественнее устаревшего FAAC), не говоря уже о превосходстве современных форматов (OGG Vorbis, AAC, MPC) над MP3. Проще говоря, из двух одинаковых треков закодированных разными кодерами с одним битрейтом какой-то будет звучать лучше, а какой-то — хуже. Кроме того, существует такое понятие, как апконверт. Т.е. можно взять трек в формате mp3 с битрейтом 96 кбит/с и конвертировать его в MP3 320 kbit/s. Мало того, что при этом качество не улучшится (ведь потерянные при предыдущем кодировании в 96 кбит/с данные уже не вернуть), оно даже ухудшится. Тут стоит указать, что на каждом этапе lossy кодирования (с любым битрейтом и любым кодером) в аудио вносится определенная порция искажений.

И даже более. Есть еще один нюанс. Если, скажем, битрейт аудио потока — 320 кбит/с, это не значит, что все 320 кбит ушли на кодирование той самой секунды. Это характерно для кодирования с постоянным битрейтом и для тех случаев, когда человек, надеясь получить максимальное, качество форсирует слишком большой постоянный битрейт (как пример — установка 512 кбит/с CBR для Nero AAC). Как известно, количество бит, выделяемое на тот или иной фрейм, регулируется психоакустической моделью. Но в случае, когда выделенное количество намного ниже установленного битрейта, то не спасает даже резервуар бит (о терминах читайте в статье «Что такое CBR, ABR, VBR?») — в итоге мы получаем бесполезные «нулевые биты», которые просто «добивают» размер фрейма до нужного (т.е. увеличивают размер потока до заданного). Кстати, это легко проверить — сожмите полученный файл архиватором (лучше 7z) и посмотрите на степень сжатия — чем она больше — тем больше нулевых битов (т.к. они приводят к избыточности), тем больше зря потраченного места.
S: DVD-Audio звучит лучше, чем Audio CD (24 bit vs 16, 96 kHz vs 44.1 и т.п.).

R: в принципе, это вполне логично, и даже отчасти правда, но вот только люди обычно смотрят только на цифры и очень редко задумываются о влиянии того или иного параметра. И так, рассмотрим для начала разрядность. Этот параметр отвечает ни за что иное, как за динамический диапазон, т.е. за разницу между самым тихим и самым громким звуками (в дБ). В цифровом аудио максимальный уровень — это 0 dBFS, а минимальный — ограничен уровнем шумов, т.е. фактически динамический диапазон по модулю равен уровню шумов. Для 16-битного аудио динамический диапазон рассчитывается как 20*log(2^16) ? 96.33 (dB). При этом динамический диапазон симфонического оркестра — до 75 дБ (в основном около 40-50 дБ).

А теперь представим реальные условия. Уровень шума в комнате — около 40 дБ (не забываем, что дБ — величина относительная. В данном случае за 0 дБ принимается порог слышимости), максимальная громкость музыки достигает 110 дБ (чтобы не было дискомфорта) — получаем разность 70 дБ. Таким образом получается, что динамический диапазон более 70 дБ в данном случае просто бесполезен. Т.е., при диапазоне выше — или громкие звуки будут достигать болевого порога, или тихие звуки будут поглощаться окружающими шумами. Достичь уровня окружающих шумов менее 15 дБ — очень трудно (так как на этом уровне находится громкость человеческого дыхания и прочих шумов обусловленных человеческим фактором), в итоге диапазон в 95 дБ для прослушивания музыки оказывается совершенно достаточным.

Но здесь есть одно «но». Если сгенерировать чистый тон с частотой например 1 кГц и уровнем -60 dBFS с 16-битной глубиной квантования, а затем его прослушать и сравнить с таким же сигналом, но сгенерированным в 24-битном виде, вы услышите различия. Причина кроется в искажении формы сигнала и появлении паразитных гармоник. Но для устранения этого неприятного эффекта, к счастью, существуют технологии Dithering и Noise Shaping.

Теперь о частоте дискретизации (частота семплирования, sample rate). Этот параметр отвечает за частоту квантования по времени и непосредственно влияет на максимальную частоту сигнала, которую можно описать данным представлением аудио. По теореме Котельникова она равна половине частоты дискретизации. Т.е. для обычной частоты семплирования в 44100 Гц максимальная частота составляющих сигнала — 22050 Гц. Максимальная же частота. которая воспринимается человеческим ухом — чуть выше 20000 Гц (и то, при рождении; по мере взросления порог опускается до 16000 Гц).

Читайте Загрузки в формате 24/192 — почему они не имеют смысла.

Подводя итог, хочу сказать, что, ~~строго говоря, DVD-Audio (настоящий конечно же, а не полученный из Audio CD) может звучать лучше Audio CD~~. Но разница настолько мала, что скорее всего слышна не будет. Куда важнее само качество записи и мастеринга — а оно в разных изданиях может отличаться, в итоге Audio CD вполне может звучать качественнее DVD-Audio.
S: Разные программные плееры звучат по-разному (e.g. foobar2000 лучше Winamp и т.п.).

R: Чтобы понять, почему это не так, надо разобраться, что собой представляет программный плеер. По сути это декодер, обработчики (опционально), плагин вывода (на один из интерфейсов — ASIO, DirectSound, WASAPI etc.), ну и конечно же GUI (графический интерфейс пользователя). Т.к. декодер в 99.5 % случаев работает по стандартному алгоритму, а плагин вывода — это всего лишь часть программы, которая передает поток звуковой карте через один из интерфейсов, то причиной различий могут быть только обработчики. Но дело в том, что обработчики обычно по-умолчанию выключены (или должны быть выключены, т.к. главное для хорошего плеера — уметь передать звук в «первозданном» виде). В итоге, предметом сравнения тут могут быть только возможности обработки и вывода, в которых, кстати говоря, необходимости очень часто вообще нет. Но даже если такая необходимость и есть — то это уже сравнение обработчиков, а никак не плееров.

Здесь я еще хотел бы упомянуть свою статью о настройке вывода звука на компьютере и, пожалуй, огорчить пользователей, восхищающихся «колоссальными» переменами в звучании после описанной в ней настройки — в 95% случаев это самовнушение (кроме конечно тех случаев, когда в ходе её настройки был выключен какой-нибудь «улучшайзер» или другой обработчик, портящий всю картину). Как это не печально, выигрыш от всех этих ухищрений с ReplayGain, ресемплерами и лимитерами — мизерный. Вывод: хотите действительно качественного звука — купите себе Hi-Fi акустику и профессиональную звуковую карту.
S: Разные версии драйвера звучат по-разному

R: В основании этого утверждения лежит банальное незнание принципов работы звуковой карты. Драйвер — это программное обеспечение, необходимое для эффективного взаимодействия устройства с операционной системой, а также обычно предоставляющее графический интерфейс пользователя для возможности управления устройством, его параметрами и т.д. Драйвер звуковой карты обеспечивает распознавание звуковой карты как звукового устройства Windows, сообщает ОС о поддерживаемых картой форматах, обеспечивает передачу несжатого PCM (обычно) потока на карту, а также даёт доступ к настройкам. Кроме того, в случае наличия софтовой обработки (средствами CPU), драйвер может содержать различные DSP (обработчики). Потому, во-первых, при отключенных эффектах и обработке, если драйвер не обеспечивает точную передачу PCM на карту, это считается грубейшей ошибкой, критическим багом. И случается это крайне редко. С другой стороны, различия между драйверами могут в обновлении алгоритмов обработки (ресемплеров, эффектов), хотя это случается тоже весьма редко. К тому же эффекты и любую обработку драйвером всё равно следует отключить/обойти для достижения наивысшего качества.

Таким образом обновления драйверов в основном ориентированы на повышение стабильности работы и устранение ошибок, связанных с обработкой. Ни то, ни другое в нашем случае на качество воспроизведения не влияет, потому в 999 случаях из 1000 драйвер влияния на звук не оказывает.
S: Лицензионные Audio CD звучат лучше, чем их копии.

R: Если при копировании не произошло ошибок (неустранимых) чтения/записи и у оптического привода устройства, на котором будет воспроизводится диск-копия, нет проблем с его чтением, то такое утверждение ошибочно и легко опровергается.
S: Режим кодирования Stereo дает лучшее качество, чем Joint Stereo.

R: Это заблуждение главным образом касается LAME MP3, так как все современные кодеры (AAC, Vorbis, Musepack) используют только режим Joint Stereo.

Для начала стоит упомянуть, что режим Joint Stereo успешно используется при lossless сжатии. Суть его заключается в том, что сигнал перед кодированием раскладывается на сумму правого и левого канала (Mid) и на их разность (Side), а затем происходит отдельное кодирование этих сигналов. В пределе (для одинаковой информации в правом и левом канале) получается двойная экономия данных. А так как в большинстве музыки информация в правом и левом каналах довольно схожа, то этот метод оказывается очень эффективным и позволяет значительно увеличить степень сжатия.

В lossy принцип тот же. Но здесь в режиме постоянного битрейта качество фрагментов со схожей информацией в двух каналах будет увеличиваться (в пределе — удваиваться), а для VBR режима в таких местах будет просто уменьшаться битрейт (не забываем, что главная задача VBR режима — стабильно поддерживать заданное качество кодирования, используя минимально возможный битрейт). Так как во время lossy кодирования приоритет (при распределении битов) отдается сумме каналов, чтобы избежать ухудшения стереопанорамы, используется динамическое переключение между режимами Joint Stereo (Mid/Side) и обычным (Left/Right) стерео на базе фреймов. Кстати говоря, причиной данного заблуждения послужило несовершенство алгоритма переключения в старых версиях LAME, а также наличие режима Forced Joint, в котором автопереключение отсутствует. В последних версиях LAME режим Joint включен по умолчанию и менять его не рекомендуется.
S: Чем шире спектр, тем качественнее запись (о спектрограммах, auCDtect и частотном диапазоне).

R: В наше время на форумах, к несчастью, очень распространено измерение качество трека линейкой по спектрограмме. Очевидно, по причине простоты такого способа. Но, как показывает практика, в действительности всё обычно намного сложнее.

А дело тут вот в чем. Спектрограмма визуально демонстрирует распределение мощности сигнала по частотам, но не может дать полного представления о звучании записи, наличии в ней искажений и артефактов компрессии. Т.е. по сути всё что можно определить по спектрограмме — это частотный диапазон (и частично — плотность спектра в районе ВЧ). Т.е., в лучшем случае, путем анализа спектрограммы можно выявить апконверт. Сравнение же спектрограмм треков, полученных путем кодирования различными кодерами, с оригиналом — полнейший абсурд. Да, вы сможете выявить различия в спектре, но вот определить, будут ли они (и в какой степени) восприниматься человеческим ухом — практически невозможно. Нельзя забывать, что задача lossy кодирования — обеспечить результат неотличимый человеческим ухом от оригинала (никак не глазом).

Это же относится и к оценке качества кодирования путем анализа треков на выходе программой auCDtect (Audiochecker, auCDtect Task Manager, Tau Analyzer, fooCDtect — это лишь оболочки для единственной в своем роде консольной программы auCDtect). Алгоритм auCDtect тоже фактически анализирует частотный диапазон и всего лишь позволяет определить (с определенной долей вероятности), было ли на каком-либо из этапов кодирования применено MPEG сжатие. Алгоритм заточен под MP3, потому его легко «обмануть» с помощью кодеков Vorbis, AAC и Musepack, так что даже если программа пишет «100% CDDA» — это не значит, что закодированное аудио на 100% соответствует исходному.

И возвращаясь непосредственно к спектрам. Популярно также стремление некоторых «энтузиастов» во что бы то ни было отключить lowpass (НЧ) фильтр в кодере LAME. И здесь на лицо непонимание принципов кодирования и психоакустики. Во-первых, кодер обрезает высокие частоты только с одной целью — сэкономить данные и использовать их для кодирования наиболее слышимого диапазона частот. Расширенный частотный диапазон может фатально сказаться на общем качестве звучания и привести к слышимым артефактам кодирования. Более того, отключение среза на 20 кГц — вообще совершенно неоправданно, так как частоты выше человек попросту не слышит.
S: Существует некая «волшебная» предустановка эквалайзера, способная значительно улучшить звучание.

R: Это не совсем так, во-первых, потому, что каждая отдельно взятая конфигурация (наушники, акустика, звуковая карта) обладает своими собственными параметрами (в частности, своей амплитудно-частотной характеристикой). И потому к каждой конфигурации должен быть свой, уникальный подход. Проще говоря, такая предустановка эквалайзера существует, но она отличается для разных конфигураций. Суть же её заключается в корректировке АЧХ тракта, а именно — в «выравнивании» нежелательных провалов и всплесков.

Также, среди людей далеких от непосредственной работы со звуком очень популярна настройка графического эквалайзера «галочкой», что фактически представляет собой повышение уровня НЧ и ВЧ составляющих, но в то же время приводит к приглушению вокала и инструментов, спектр звучания которых находится в районе средних частот.

Информация от спонсора

SERENITY: создание, раскрутка и продвижение сайтов. Продвижение в социальных сетях, создание фирменного стиля. Благодаря консультациям и помощи профессионалов, Вам удастся значительно увеличить свою прибыль в сфере интернет-маркетинга.

Категория: Теория | Автор:Taras Kovrijenko | Добавил: Audiophile (2013-12-10T13:16)

Просмотров: 29998 | Комментарии: 12 | Рейтинг: 5.0/5, голосов: 2

Всего комментариев: 12

Порядок вывода комментариев:

Спам

[11] estereo (24 Февраля 2013 04:01)

я кодирую --silent -V 0 --noreplaygain - %d dont_know

Спам

[12] Audiophile (24 Февраля 2013 11:08)

Это к чему?

Спам

[8] Rollinnn (17 Февраля 2013 17:00)

Цитата

Если сгенерировать чистый тон с частотой например 1 кГц и уровнем — 60 dBFS с 16-битной глубиной квантования, а затем его прослушать и сравнить с таким же сигналом, но сгенерированным в 24-битном виде, вы услышите различия.

И часто ли Вам удавалось их (различия) услышать на той громкости, на которой обычно музыку слушаете?

Спам

[9] Audiophile (17 Февраля 2013 17:08)

нет конечно. Да я и не ставил подобные опыты. И так ясно, что в 99% случаев их будет неслышно.

Спам

[10] Rollinnn (22 Февраля 2013 19:08)

Вот, кстати, увлекательное чтиво по этому вопросу:http://people.xiph.org/~xiphmont/demo/neil-young.html
И ещё интереснее, результаты слепого теста: http://www.drewdaniels.com/audible.pdf
Описание аппаратуры, используемой в тестеhttp://www.bostonaudiosociety.org/explanation.htm

Спам

[7] alexandep (07 Июля 2011 19:14)

Всё как раз наоборот. WASAPI и ASIO оба дают bit matched поток, так что тут как раз и есть эффект пустышки. А ресемплеры на некоторых картах вполне способны помочь избежать некачественной передискретизации. А еще бывает глубокий клиппинг в некоторых MP3 - там лимитер спасает очень хорошо.
MP3 и другие lossy я не использую (просто не хочу заморачиваться с возможными побочными эффектами вроде клиппинга, а места на хранение lossless мне не жалко).
Вообще, может я ошибаюсь. Скорее всего, WASAPI я и не слушал толком-то по времени. А на продукции Creative (Audigy 2 ZS в моём случае) довольно сомнительный ресемплинг на самой карте, если верить "слухам". Так что и такой вариант возможен.

Спам

[6] alexandep (07 Июля 2011 18:43)

Как это не печально, выигрыш от всех этих ухищрений с ReplayGain, ресемплерами и лимитерами - мизерный.
Ну, от ресемплеров и лимитеров, понятное дело, нет, но вот как-то не получается объяснить банальной "плацебой" улучшение звучания от переезда с wasapi exclusive на аппаратный asio. Выражаясь дурными аудиофильскими оборотами: "сцена стала шире и глубже". sarcastic

Разборчивость партий (особенно на "ватных" записях) не то, чтобы как-то кардинально улучшилась, но улучшилась всё же. Нет, даже самое первое, что я заметил после включения ASIO - заметно улучшились дела у сустейна.

Ответ:

Quote

Ну, от ресемплеров и лимитеров, понятное дело, нет, но вот как-то не получается объяснить банальной "плацебой" улучшение звучания от переезда с wasapi exclusive на аппаратный asio.

Спам

[5] alkahook (09 Мая 2011 12:02)

первое или второе? crazy

если с первым не всё так однозначно - тут зависит от железа, жанра и ушей - но в целом можно говорить, что не отличимо
а вот капча просто отбивает всякое желание что-либо писать.. убрали бы вы её

Ответ: Капча выполняет свою функцию.

Насчет первого - действительно, не надо такой категоричности.

Спам

[4] alkahook (08 Мая 2011 04:05)

чушь
в высоком битреде не отличить мп3 от лоси
как бы кто не старался crazy

зы. с такими кодами хрен тут писать будут

Ответ: вы это гарантируете?

Спам

[3] Pulse (23 Апреля 2011 07:27)

Можно ещё добавить заблуждение о том, что Image рип аудио компакт диска лучше чем потрековый.

Спам

[2] igor-tf (12 Апреля 2011 10:01)

Это я к тому,что вы все замечательно пишете. Но народ наш инструкций читать не привык...

Судят по битрейту,пользуются мп3 несмотря на очевидные преимущества новых кодеров OGG,wavpack lossy,mpc и др... И полным счастьем считают мп3 320 CBR . Хотя сам разработчик рекомендует VBR. dont_know

Нормальной поддержкой всех форматов кроме мп3 никто не занимается-так,в основном,для галочки... Благо,хоть Фубар есть.
Печально,но,похоже,никому это не нужно кроме нас с вами и еще горстки энтузиастов...

Ответ: Пользуются MP3, так как поддержка широкая. А 320 - чтобы получить максимум качества.

Спам

[1] igor-tf (11 Апреля 2011 09:15)

Почитать бы это тем кто упорно кодирует в 320 CBR...

Ответ: Это вы к чему?