Audiophile's Blog
Логин:Пароль:


Забыл пароль | Регистрация (убрать всю рекламу)
О сайте | Ликбез | Словарь | Audiophile's Testroom | Поддержать | Контакты
Разделы
Поиск по сайту
Популярное
Персональная настройка
Настройка звука онлайн (foobar2000, драйвера, Windows), создание персональных сборок foobar2000.

Контакты

Случайный опрос
Какой битрейт (средний) вы считаете оптимальным для lossy кодирования?
Всего ответов: 5566
Полезный софт
Opera QIP 2010 Download Master µTorrent
Ace Utilities AIDA64 SpeedFan 7-Zip
ESET NOD32 FileZilla Media Player Classic Home Cinema Paint.NET
Sony Sound Forge VirtualDub Unlocker Punto Switcher
Похожие проекты
Сейчас на сайте
Онлайн всего: 25
Гостей: 23
Пользователей: 2
Advokatvlad, mpuzirew
»

О режиме VBR LAME (продолжение). VBR V2/V1/V0 vs CBR 320


22 Ноября 2013, 22:21

Сегодня продолжил своё расследование на тему выбора значения параметра -V для режима VBR LAME 3.99.5. Напомню, в прошлой новости я писал, что мне удалось легко отличить закодированный семпл фортепианного соло в режимах CBR 128 q0 и VBR V2 на относительно недорогой акустике Microlab Pro 2.

Я решил поднять планку, увеличив качество до -V1, а затем и до -V0 (максимальное для режима с переменным битрейтом).

Вот лог для режима VBR V1:

Цитата
foo_abx 1.3.4 report
foobar2000 v1.3 beta 5
2013/11/22 20:05:07

File A: D:\musorgsky_bydlo.wav
File B: D:\07. Tableaux dune Exposition - Bydto.mp3

20:05:07 : Test started.
20:06:07 : 01/01 50.0%
20:07:06 : 02/02 25.0%
20:07:18 : 03/03 12.5%
20:07:33 : 04/04 6.3%
20:07:47 : 05/05 3.1%
20:08:09 : 06/06 1.6%
20:08:20 : 07/07 0.8%
20:08:21 : Test finished.

----------
Total: 7/7 (0.8%)

Эффект был аналогичен -V2: на протяжении всей композиции звук «плавал», фоновые шумы давились, а также пострадала общая звонкость.

С V0 оказалось несколько иначе:

Цитата
foo_abx 1.3.4 report
foobar2000 v1.3 beta 5
2013/11/22 20:09:06

File A: D:\musorgsky_bydlo.wav
File B: D:\07. Tableaux dune Exposition - Bydtov0.mp3

20:09:06 : Test started.
20:10:00 : 00/01 100.0%
20:10:17 : 01/02 75.0%
20:10:20 : Trial reset.
20:10:50 : 01/01 50.0%
20:11:33 : 01/02 75.0%
20:12:15 : 01/03 87.5%
20:13:04 : 02/04 68.8%
20:13:11 : 03/05 50.0%
20:13:24 : 04/06 34.4%
20:13:36 : 05/07 22.7%
20:13:50 : 06/08 14.5%
20:14:32 : 07/09 9.0%
20:14:44 : 08/10 5.5%
20:14:51 : 09/11 3.3%
20:15:03 : 10/12 1.9%
20:15:20 : 11/13 1.1%
20:15:35 : 11/14 2.9%
20:15:42 : 12/15 1.8%
20:15:58 : 13/16 1.1%
20:16:06 : 14/17 0.6%
20:16:07 : Test finished.

----------
Total: 15/19 (1.0%)

Отличить MP3 было очень сложно. В целом композиция звучала практически неотличимо от оригинала, однако мне удалось уловить отличия на паре аккордов, где кодирование отразилось на звонкости.

Таким образом на V0 таки обнаружился некоторый «порог», и отличия V1->V0 более значительны, чем V-2->V1.

Давайте рассмотрим некоторые технические детали. Битрейты для выходных файлов получились 189, 224 и 268 кбит/с соответственно. Взглянем на спектрограммы:

Здесь прежде всего надо отметить, что V0 дал нам практически полное отсутствие разреженности в диапазоне 14-16 кГц, за счет чего он, скорей всего, и обеспечил достойный уровень качества. Но также мы видим, что LAME во всех случаях жестко режет спектр до 16 кГц, несмотря на то, что в оригинале спектр инструмента простирается вплоть до 22 кГц. И это при том, что значения среза для НЧ фильтра здесь равны 18000, 19500 и 22100 Гц соответственно. Таким образом, спектр режет именно психоакустическая модель — вероятно, опираясь на данные о пороге слышимости и маскировке.

Еще недавно, в записи Частотный слух: что мы слышим на самом деле? я рассматривал восприятие частот выше 16 кГц в реальных музыкальных композициях. Таких композиций, где бы улавливалось отсутствие этих самых частот, оказалось совсем немного, однако вполне возможно, что рассматриваемый сегодня семпл относится именно к таким случаям. Т.е. скорее всего я отличил V0 не по артефактам психоакустики, а именно благодаря срезу на 16 кГц.

Кстати говоря, этот порог на 16 кГц — просто проклятие режима VBR, да и всего MP3 в целом (я несколько раз встречал упоминание о проблемах MP3 — то ли с заданием квантизеров, то ли с масштабным коэффициентом для этого самого диапазона >16 kHz). Частично именно из-за этих частот я при случае использую не V0, а CBR 320 — этот режим даёт вполне ощутимый прирост относительно VBR на многих сложных композициях, и не только благодаря отсутствию среза. Кстати, на спектр той же композиции закодированной в CBR 320 q0 можете взглянуть сами:

Конечно, фоновый шум в диапазоне >16 кГц продолжает давиться (иначе это был бы не MP3), но вот полезный сигнал уже имеет спектр куда шире 16 кГц. Именно это стало решающим фактором при моих неудачных попытках отличить здесь CBR 320 от оригинала.

Что ж, попробуем сравнить все 4 режима по техническим деталям. Из LAME Tag мы можем видеть, что CBR использует иную модель ATH (порога слышимости) — 4 вместо 5:

Так что возможно, я был прав насчет причин вырезания частот выше 16 кГц у VBR. К сожалению, в последних версиях манипуляции с ATH через командную строку не поддерживаются, и проверить предположения не представляется возможным.

Далее я обнаружил у V2, в отличие от других режимов, некоторый процент MS фреймов — 2.3% фреймов оказалось закодировано в режиме Mid/Side stereo, в то время как остальные режимы кодировали каналы раздельно. На слух отличий в стереопанораме я не уловил, но сам факт весьма любопытен.

Процентное соотношение битрейта фреймов:

Здесь можно отметить отсутствие у V0 фреймов с битрейтом ниже 224 кбит/с.

Ну и еще одним интересным фактом можно назвать то, что по данным MP3Packer для CBR 320 максимальный битрейт, используемый фреймом (с учетом резервуара бит), составил 442 кбит/с, а для VBR V0 — 452. Впрочем, это скорее случайность, обусловленная особенностями работы резервуара бит и различиями психоакустики режимов.

Подводя итог, хочу заключить: хотя VBR V0 и обеспечивает качество значительно лучшее, чем V1/V2, реальная выгода от его использования весьма сомнительна. На деле мы конечно получили экономию 16% объема (относительно 320 кбит/с), но в то же время получили и переход искажений в слышимую область. Таким образом, если вы гонитесь за качеством и вынуждены при этом использовать MP3, я всё же рекомендую CBR 320 и не считаю, что кодирование в этом режиме есть пустая трата места на жестком диске. Что же касается VBR V2 и V0, я всё же склоняюсь к первому, так как на большинстве композиций данный режим таки обеспечивает прозрачное качество, при этом являясь лучшим по соотношению размер/качество.

[Обсудить на форуме]


Информация от спонсора

a7 сервис: обслуживание компьютеров в Санкт-Петербурге. Абонентское обслуживание компьютеров включает в себя плановые, не плановые (срочные) выезды, а также возможность удалённого администрирования.

 
   
Просмотров: 6467 | Автор: | Добавил: Audiophile () | Рейтинг: 5.0/5, голосов: 3
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
Авторские статьи
Сообщество
Последнее на форуме
Кодеки
TAK FLAC APE WV
MPC OGG AAC/ALAC MP3
WMA TTA OFR LA
Теги
Follow me
Twitter YouTube
Google+ Facebook
Полезные ссылки
Copyright Taras Kovrijenko © 2009–2016