Хоть сегодня MP3 и не самый качественный lossy аудио кодек, всё же он бесспорно является лидером за счет своей огромной популярности и совместимости с практически всеми аппаратными и софтовыми плеерами.
LAME (аббревиатура от LAME Ain’t an MP3 Encoder) - это свободное приложение для кодирования аудио в формат MP3 (MPEG-1/2/2.5 Layer 3). По показателям качества дает лучший результат среди кодеров МР3.
В комплекте имеются:
lame.exe (command-line encoder)
lame_enc.dll (encoding library)
Включает кодирование с заданным (в килобитах) целевым средним битрейтом с поддержкой фреймов разных размеров. Допустимые значения - целые числа от 8 до 310.
Может быть использовано с ключами -b и -B, например:
lame --abr 123 -b 64 -B 192 a.wav a.mp3
данная комбинация ключей установит ограничение на размер фреймов от 64 до 192 кбит.
Для MPEG1 (частота семплирования 32, 44.1 и 48 kHz)
n = 32,40,48,56,64,80,96,112,128,160,192,224,256,320
Для MPEG2 (частота семплирования 16, 22.05 и 24 kHz)
n = 8,16,24,32,40,48,56,64,80,96,112,128,144,160
По-умолчанию - 128 кбит/с для MPEG1 и 64 кбит/с для MPEG2.
Когда используется режим кодирования с переменным битрейтом (VBR), ключ -b определяет минимальный допустимый битрейт. Естественно,чтобы предотвратить лишние затраты места, наименьший доступный размер фрейма будет использоваться для тишины.
Установить частоту фильтрации высоких частот. Частоты ниже указанной будут обрезаны. Минимальное значение равно 1.0887 % от частоты дискретизации. Для 44.1 кГц — 0.481 кГц.
Установить ширину спада АЧХ для фильтра высоких частот (в кГц или Гц). Значение по-умолчанию (и, также, минимально возможное) — 1/64 от частоты дискретизации.
Установить ширину спада АЧХ для фильтра низких частот (в кГц или Гц). Значение по-умолчанию (и, также, минимально возможное) — 1/64 от частоты дискретизации.
Joint-stereo является режимом по-умолчанию для двухканальных входных файлов.
stereo
В этом режиме кодер не использует возможность корреляции между двумя каналами. Естественно, это может негативно сказаться на количестве битов отведенных обоим каналам. В этом режиме кодер предоставляет одному из каналов меньшее количество битов если тот содержит тишину или же является менее сложным.
joint stereo
В этом режиме кодер использует корреляцию между двумя каналами. Сигнал раскладывается на сумму ("mid"), рассчитанную как L+R, и разницу ("side"), рассчитанную как L-R, большее количество бит выделяется каналу mid.
Такой прием эффективно увеличивает пропускную способность для сигналов с небольшим разделением стерео и дает существенный прирост качества кодирования. В режиме joint stereo, кодер может переключаться между Left/Right и Mid/Side представлением для каждого фрейма в зависимости от его содержимого.
Неуместное использование mid/side стерео может привести к слышимым артефактам компрессии. Слишком частое переключение между режимом mid/side и обычным режимом также может сказаться на качестве звучания. Для определения моментов переключения в режим mid/side стерео LAME использует достаточно сложный алгоритм описанный в документации ISO, использование режима joint stereo совершенно безопасно.
forced joint stereo
Этот режим принудительно включает MS joint stereo для всех фреймов. Немного более быстрый чем обычный joint stereo, использование рекомендуется только в том случае, когда Вы уверены, что кодируемый сигнал имеет очень незначительное разделение стерео.
dual channels
В этом режиме 2 канала кодируются совершенно независимо. Каждому каналу выделяется ровно половина битрейта. Этот режим разработан для таких случаев как например двуязычное кодирование (один язык в левом канале, другой язык - в правом). Использование данного режима для обычных стерео файлов приведет к более низкому качеству кодирования.
mono
Входной сигнал будет кодирован как моно. Если сигнал изначально являлся стерео, он будет сведен в моно. Сведение производится суммированием каналов со смягчением в 6 дБ.
Включить защиту от ошибок CRC.
Добавляет циклический избыточный код (cyclic redundancy check, CRC) в каждый фрейм, позволяющий детектировать ошибки передачи которые могут произойти в MP3 потоке. Конечно же, код занимает 16 бит каждого фрейма, которые в противном случае были бы использованы для кодирования, в результате чего качество звучания незначительно уменьшится.
Включает использование предустановленных настроек. На данный момент предустановки устарели и настоятельно не рекомендуются к использованию. Таблица соответствий пресетов следующая:
--preset medium
-V 5 --vbr-old
--preset standard
-V 2 --vbr-old
--preset extreme
-V 0 --vbr-old
--preset insane
-b 320
--preset fast xxx
включает режим --vbr-new (если не использовать пресеты, он включен по умолчанию)
Без сомнения, битрейт является главным фактором влияющим на качество. Чем выше битрейт - тем выше качество. Но кроме выбора битрейта, мы имеем возможность выбора алгоритмов для достижения наилучших коэффициентов масштабирования и кодирования Хаффмана.
-q 0: использовать самые медленные и максимально качественные алгоритмы. -q 0 и -q 1 являются медленными и могут не дать значительного прироста качества.
-q 2: рекомендуется. Аналогично ключу -h.
-q 5: хорошая скорость, разумное качество.
-q 7: аналогично ключу -f. Очень быстрое кодирования, приемлемое качество. Психоакустика используется для пре-эхо и M/S, маскировка шума не производится.
-q 9: отключает практически все алгоритмы включая психоакустическую модель. Низкое качество.
Примечания:
Для режима CBR и ABR значением по-умолчанию является -q3. Ниже приведена таблица алгоритмов для различных значений -q (только для CBR и ABR. 0=отключен,1=включен,2=особый режим работы).
(cпасибо уважаемому barzzzer'у с форума torrents.ru, данная таблица сделана им на основе исходников LAME 3.98.2)
Как показали тесты, для VBR кодирования существует только два режима выбора алгоритмов, при чем самый качественный стоит по-умолчанию, а второй (немного более быстрый, но менее качественный) включается при значении -q от 5 до 9, или же просто ключем -f.
* --resample 8/11.025/12/16/22.05/24/32/44.1/48выходная частота семплирования в кГц
Выбрать выходную частоту семплирования (только для кодирования).
Если не указана, LAME автоматически ресемплирует входной сигнал при использовании высокой степени сжатия
* --silent / --quietтихий режим
Не отображать отчет в процессе выполнения операции.
* -V 0...9установка качества для режима VBR
Включает режим VBR (Variable BitRate, переменный битрейт) и указывает значение качества VBR .
по-умолчанию=4
0=максимальное качество.
[Полное описание и список параметров (EN)]
Рекомендации и примеры
Рекомендованным режимом является режим VBR - он дает лучшую скорость кодирования и стабильное качество звучания для сигналов разной степени сложности.
Ниже приведены примеры параметров для конвертера foobar2000:
Приемлемое качество для большинства слушателей: --silent -V 2 --noreplaygain - %d
Более высокое качество, 320 кбит/с (чуть более низкая скорость кодирования): --silent -q 2 -b 320 --noreplaygain - %d
Максимально возможное качество, 320 кбит/с, CBR (в большинстве случаев не дает прироста в качестве, очень медленное кодирование): --silent -b 320 -q 0 --noreplaygain - %d
Пояснения: -q - параметр регулирует соотношение скорость/качество. Значение по-умолчанию - 3. --silent - параметр задан в связи с тем что foobar2000 автоматически скрывает консольное окно кодировщика. --noreplaygain - отключение анализа ReplayGain кодером LAME, что немного повысит скорость кодирования. Foobar2000 самостоятельно выполняет ReplayGain сканирование (если оно включено в настройках конвертера).
Спасибо зо ответесть еще вопрос интересует максимально возможное качество при минимально возможном размере (качество как CBR 128 kbps вполне устроит), может есть какие-то настройки какие вы посоветуете и есть мнение что для этого кодер от Fhraunhofer больше подхотит и еще есть программа MP3Repack увеличивает сжатие при том же качестве насколько целесообразно ее использовать ??
Ответ: Репакер оптимизирует только старые MP3 320, новый LAME более рационально использует битрейт. Оптимальное соотношение размер/качество - это VBR V2 (~200 kbps). D раоне 128 - это VBR V 5.5, кажется, но там весьма спорно для музыки - иногда -b 128 -q 0 может быть лучше. Для 128 действительно можно использовать FhG, иногда он дает хорошие результаты.
Ясно, еще вопрос имеет смысл -Z --athtype 3 чтоб окончательно развеят все сомнения
Ответ: -z уже нету, а менять значение Absolute Threshold of Hearing нет смысла, кодер сам подбирает.
Я же написал настройки для максимального качества.
Хочу узнать что думает автор об этой статье
http://foobar2000.ru/forum/viewtopic.php?p=20288
а имено Версия LAME имеет значение Lame v.3.93.1 — это последний «первозданный» алгоритм Lame. Его уникальность заключается в сохранении спектра высоких частот, соответственно, наличие «слабой» психоакустической обработки, в отличие от новых версий, где ей уделяется очень большое внимание. Оптимальные паркметры комендной строки lame.exe: --cbr -b320 -q0 -k -p -ms -Z --athtype 3
:scratch:
Ответ: Старая тема. Плод воспаленного ума аудиофила-эзотерика. наличие «слабой» психоакустической обработки - а не странно ли это для кодека, который основан на психоакустике?
Уважаемы Audiophile! Хоть я не любитель МР3, но для интереса сравнивал работу Lame 3.99.5 с Lame 3.97. И вот что я заметил: в режиме работы VBR на режиме качества -Q 0 3.97 давал на альбоме битрейт в среднем 240-250 кбит/с, а 3.99.5 дал битрейт в 190-200 кбит/с. Правда разницы в звучании я не нашел, но на более простом треке 3.97 дал битрейт в ~165 кбит/с, а 3.99.5 дал 190 кбит/с. Вот вам и МР3
Ответ: 3.97, 3.98 и 3.99 имеют различные алгоритмы VBR кодирования, так что здесь нет ничего удивительного.
Я в этих делах новичок. Возникло пару вопросов. Использую Cuetools, LAME 3.99.5 c параметрами для CBR (-b %M -q 0 --noreplaygain - %O) для VBR (-V %M --noreplaygain - %O).
MediaInfo строка настройки программы:
CBR: -m j -V 4 -q 0 -lowpass 20.5 Что такое -V 4
VBR: -m j -V 0 -q 0 -lowpass 22.1 --vbr-new -b 32 Почему --vbr-new а не --vbr-mt (по умолчанию)
И ещё один вопросик. Имеет ли значение последовательность параметров н-р: -b 320 -q 0 или -q 0 -b 320. Или опции кодирования для FLAC: -V -4 или -4 -V.
Ответ: Меньше верьте MediaInfo. В нем зашиты соответствия ключей из LAME Tag и отображаемых параметров. В LAME Tag для CBR звписывается параметр Quality = 60 (при q0), для VBR V0 - 100, для V1 - 90, соответственно V4 - это 60.
Специально зарегистрировался, чтобы выразить ОГРОМНУЮ благодарность автору данного ресурса. Со вчерашеного дян тут сижу)) Очень практичные, понятные, толковые и полезные статьи. Как раз нужно было разобраться с различными аспектами рабоыт в foobar'е, и это получилось только благодаря Вам Единственные сайт, на котором всё по существу, в тему и профессионально:)
Огромное спасибо за ваши статьи.
Фигня какая-то.Сейчас спустя какое-то время опять попробовал - всё нормально. На многих лосях такое было,даже на потрековом.Были лишние сэмплы и лишнее время.Сейчас всё нормально,сэмплы совпадают.Очень странно.Настройки я вообще не трогал свои,как настроил один раз VBR Q0 так и стоит.
День добрый,дядь Аудиофил,а вы не знаете,почему лама 3.99.4 добавляет в конец трека лишние 2 секунды тишины?Либо же наоборот секунду или чуть меньше убирает в конце,а иногда нормально.От чего это зависит?Сам ламе кривой или дело в исходнике?Может куй виноват?А раньше вообще такое было?Что-то я не замечал,вроде по семплам сравнивал,всё было идентично,что в лосе,что в mp3.Ну уж точно 2 секунды он не добавлял в конец.
Ответ: Думаю, дело в CUE и foobar2000. Пришлите содержимое проблемного CUE.
Здравствуйте!!! Я начинающий так сказать в этом деле, и у меня вопрос ко всем "аудиофилам" и понимающим в этом деле :).
Почему при кодировании (foobar2000 1.1.10) с FLAC в MP3 последней версией lame.exe (взятой с этого сайта) показывает такие параметры вот при настройке на максимальном качетсве (--silent -b 320 -q 0 --noreplaygain - %d)
Ответ: Это всё значит только то, что в EncSpot несовершенные алгоритмы расчета битрейта и определения кодера (впрочем, последнее всё равно не всегда можно определить).
У вас там показывает, что размер разный получается у файлов. Программа расчитывает битрейт, деля размер на время. Проверьте размер выходных файлов в свойствах в системе. Т.к. при кодировании с ключами q0, q2 и q3 файлы получаются идентичные до байта и повторить вашу проблему не удалось с помощью Lame 3.99.
Не соглашусь с Вами. Глаза + теория будут точнее любых ушей. Уверен, создатели той же ИКМ были уверены в качестве еще до того, как смогли услышать ушами результат ее работы. Если говорить не о воспринимаемом качестве (обманка), а о степени абсолютной близости конверта к оригиналу, то здесь ушам не место, здесь только приборы, ум и глаза. Вы же понимаете, если добиться в разнице (потерьный файл) тишины, любым ушам это понравится. Психоакустика используется, чтобы обманывать мозг, уши. Большинство тестов, включая ABX, основаны на осознании качества. Проще говоря, пользуют неидеальность слуха человека. Я придерживаюсь мнения, что музыка и звук несет нам больше информации, чем мы способны осознать. Отсюда иная цель - не обманывать мозг, а минимизировать потери количественно, фактически, приборно. Понимаете разницу? Потерь (искажений) должно быть мало на самом деле, а не казалось ушам, что их мало. Психоакустика кодера вносит ряд своих изменений в сигнал, якобы не осознаваемых. Поэтому и спросил, что Вы думаете: добавляет дополнительную погрешность (фактическую) психоакустика кодера или нет? Можно ли заставить LAME не резать полосами спектр с помощью -q, а внести равномерные искажения согласно высокому битрейту?
Вот смотрите, образно: Есть звучание оркестра - звук оригинал. Есть его запись на, например, пленке (аналоговая). Есть оцифровка этой пленки. Понятно, пленка шумит, толпе не нравится это, умный дядька берет шумодав и режет шум, ну и звук оркестра заодно, куда ж без этого. Толпа не против, все довольны. Так вот, я хочу запись с потерями, но без этого шумодава. Она с потерями, она с шумом, но она ближе к оригиналу физически. Является ли ключ Q - управлением этим шумодавом?
MP3 меня интересует не ради забавы, а лишь ради аппаратной совместимости во многих устройствах. Был бы в стандарте максимальный битрейт 2000 или же все устройства поддерживали бы FLAC или WAV (с флеш-накопителя), я бы не занимался антинаучными исследованиями, как Вы выразились. Для меня тесты всё необходимое выявили, все мифы (посеянные в сети) легко были развеяны, кроме работы ключа q, который никого не интересует. Все "хавают" ключ q0 и довольны этим шумодавом.
Ответ: Вы кривые равной громкости видели? Про частотную, временную маскировку слышали? Да какой теорией вы всю это нелинейность хотите описать? А есть еще особенности отдельных людей и аппаратуры.
Кодеки - это не тракт усилителя или звукозаписи, они обрабатывают с расчетом на особенности человеческого слуха, и только с помощью слуха результат можно оценивать.
Всё, довольно.
Во дела...Q - quality,качество алгоритмов.Чем ниже цифра,тем лучше качество,прочтите на оф.сайте,разработчики пишут,как и что.А для простоты понимания сконвертируйте wav в mp3 128Q0 и 128Q9,послушайте и сделайте вывод,что лучше звучит и какой "шум" вам более близок к сердцу.)И вообще,хватит качество звука мерять спектрами,только уши и всё!Музыку надо слушать!Спектры могут лишь показать,апконверт или нет,лось или нет,ну и ещё кое-чего,но ни как по нему нельзя судить качество звука.А почему вы думаете люди смотрят на спектр постоянно?Да потому что ухом не способны определить,лось или пережатка,например,вот и прибегают к таким методам.Просто чтобы удостовериться,что заявленное качество соответсвует действительности.Это только один случай.А во всём остальном только ушами слушать и всё.И ещё,в защиту лосси могу сказать,что чтобы вам не говорили,что бы не писали и не втирали,всё нужно делать только самому,а именно слушать!А тут черпать нужную для себя информацию,и любому лосси формату нужно отдать должное!Какие бы искажения он не вносил,что бы там про него не говорили,он заслуживает внимания и уважения,потому что качество лосси сжатия весьма и весьма приличное!Особенно сейчас,когда так активно всё развивается.Если на слух вы ничего не отличаете,то есть q0 и q9,то зачем эти мороки со спектрами и приборами?Слушайте музыку и всё.
Вы, как и автор данного сайта, не слушаете или не слышите меня. На этом неслушании основаны все Ваши аргументы. Я еще раз заостряю внимание на разнице двух качеств: абсолютного качества и воспринимаемого. Я говорю об абсолютном, а Вы - о ТОЛЬКО воспринимаемом. Я уже не знаю, как объяснить разницу. Возьмите глаза. Почему все считают, что в радуге 7 цветов? Потому что большинство не способно ОСОЗНАТЬ разницу единичных цветов больше, чем 7 штук. Но при этом покажи человеку фото, пастеризованное на 7 цветов? Он сразу скажет, да это совсем не похоже на оригинал! Что такое абсолютное качество 100%? Это ТОЛЬКО реальное изображение (звук) - оригинал, источник. Ни одно устройство не способно его сохранить/передать. Стоит говорить лишь о близости к абсолютному качеству. Близость к абсолютному качеству и близость к воспринимаемому качеству - это разные шкалы. Это верх непонимания вопроса, обсуждать со мной совершенно другую шкалу, тыкать меня в ее законы!
Ребята, если изобретут резиновую женщину, которую не сможете в темноте отличить от живой женщины, это НЕ значит, что резиновая обладает абсолютным качеством 100%. Воспринимаемым - да. Боюсь, понимание этого вопроса выходит за рамки аудиофильского понимания звуковосприятия. Но именно так я пытаюсь объяснить свою заинтересованность именно абсолютным качеством. В то время, как Вы зациклены на воспринимаемом.
Ну вы,конечно,загнули.Если я вас правильно понял,то напишу вот что...Но прежде,чем я это сделаю хочу сказать,что если я опять вас не понял,то не ругайтесь,ну в целом я понял суть вашей проблемы.А может и нет. В общем,по сути абсолютного качества не существует!И это моё мнение(это важно).Ни одна аппаратура,будь то хай фай или хай энд,ни одни колонки в мире!!!Никакие золотые провода,никакие флаки и супер мега хич блю рэй мульти семь диски не могут передать абсолютного качества!Потому что всё это будет звучать по-разному и для всех.И никто и никогда не может с точностью сказать,где звучит истина.Потому что каждый человек - индивид,каждому своё.По сути,как вы выразились,если хотите оригинал,то вам надо в студию,где лежат оригиналы,мастер ленты и так далее.Нам уже пихают нечто другое,но схоже с оригиналом.Даже если человек будет просто петь без ничего на улице,просто петь без микрофона,каждый человек воспримет его по-разному,хотя по большому счёту из его уст льётся абсолютное качество. Но если его записать на микрофон в супер формате,всё равно это уже будет не то,опять же усилки,колонки и прочее.Ну я вот так вас понял,и так рассуждаю.Так что если я опять не в тему,то извиняйте.Проще говоря - идеального качества в природе нет,как и нет в звуке какого-то стандарта.Есть разновидности и их великое множество,и каждый выбирает себе сам.
Вооот, уже начинаете соображать. Только абсолютное качество есть. Оно существует независимо от слушателя. Вот тот певец на улице (или оркестр) - он первоисточник, он абсолютное качество 100%, он творец. Даже если этот звук никто не слышит. Отсюда имеем: я бы взял за абсолютное качество звука 100% - это набор физических характеристик колебаний воздуха, исходящих непосредственно от первоисточника звука. Я уже говорил, сохранить 100% невозможно. Вы это подтверждаете, а значит начинаете понимать меня. Вот продолжайте думать в том же направлении, только давайте говорить об реальных 1%-90% по этой шкале абсолютности. Можно их сохранить? Конечно, можно! Вот наша задача понять, q0 это, допустим, 62%, а q9 это, допустим, 69% АБСОЛЮТНОГО качества или наоборот? Уши и прочая ахинея тут не причем. Звук существует независимо от слушателя и если говорить об абсолютности, то его нужно сравнивать именно приборами, то есть сравнивать физические характеристики. А не заниматься психологией, биологией, как надурить мозг человека и его уши.
Я прекрасно понимаю, что создатели мп3 обязаны руководствовать именно психологией, т.к. при экономии бит приходится по-любому дурить мозг. Но я же четко объяснил, что ставлю задачу СОВЕРШЕННО другую, но в пределах формата мп3.
Я предлагаю заниматься абсолютным приближением звука, а не дуриловкой своих ушей и мозга. Я так понял, аудиофилы за нулевую точку отсчета берут свои уши (эгоцентризм), а я хочу за ноль взять именно звук первоисточника. Представьте, что результат сохранения звука никто и никогда не услышит, никакими ушами, но, тем не менее, у нас стоит задача приблизить запись к первоисточнику как можно ближе. И разницы нет, идет речь о единицах процентов приближения или о десятках, как то 95% или 99%. Я считаю, метод вычитания сигналов и является таким абсолютным измерителем потерь. Он вычисляет абсолютные потери, несмотря на уши человека или собаки, психологию, биологию, зоологию и прочую ерунду, которой Вам забили мозг mp3шники (и правильно сделали).
Вот знаете, у батарейки 1,5 вольта напряжение. Я хочу воссоздать эти ее 1,5 вольта от блока регулируемого напряжения, чтоб питать часы, скажем. Я обратился на сайт: вот если крутнуть влево реостат, будет 1,6 вольт или 1,4 вольт? А мне дали понять, что я занимаюсь антинаучной ерундой и если щупать языком напряжение, то я никогда не пойму разницу между 1,4 и 1,6 вольтами. И, мол, зачем мне это всё нужно, и какая разница, если разницу не чувствует язык. Почему никто не понимает, что мне нужно напряжение 1,5 (или близкое) без языка, а физически чтоб там было 1.5 вольта? Просто идентичное напряжение первоисточнику - батарейки. Почему все суют язык и спорят со мной, что разницы нет? Нужно просто измерить. Если нельзя 1,5, значит 1,4. И мне все равно, что 2,3 вольта больше похоже языком на 1,5 и ученые мп3шники это уже доказали. Далее ссылки на сайты ученых... Ощущение, что у этих людей Вселенная вся крутится вокруг собственного слуха и ушей.
Вся моя теория основывается на том, что человек по своей сути самодовольный глупец, пытающийся постоянно бежать впереди паровоза. Я снова повторюсь, музыка несет собой радость не только нотами (осознанная часть), но и звуками (неосознанная). Так если часть удовольствия лежит за пределами сознания, почему бы аудиофилам не научиться сравнивать звук по абсолютной шкале, приборами, дабы приближенность ограничивалась только возможностями этих приборов. Чтобы звук изначально играл хотя бы на 50% идентично оригиналу (независимо от восприятия). А сейчас получается мне говорят: ну играет ОНО другую мелодию, и что??? ОНО же так похоже на слух и радуйся.
Я б не обиделся, если б со мной спорили домохозяйки, обожающие мп3-128. Но вы, люди с повышенными требованиями к звуку, зделавшие кучу шагов в сторону познания технологий звукозаписи и тут оперируете такими аргументами, что музыку нужно слушать ушами. Музыку (результат звукозаписи) нужно слушать ушами, а выбирать технологии звукозаписи нужно мозгами и приборами! Выбираете технологии ушами? Воля Ваша Я не считаю, что мои уши умеют анализировать структуру звука, несущую удовольствие от музыки. Уверен, Ваши тоже.
Очень сильно взорвали мой мозг,но всё понятно. Так ткните прибором и узнайте,что и как.Если исходить из ваших мыслей,то получается,что да,q9 даёт абсолютное качество,так как отключаются все или практически все алгоритмы,из-за этого и скорость кодирования выше.Не знаю,какую вы там музыку слушаете,видимо что-то хорошее и мелодичное.Потому как я слушаю старый трэш и дэт метал 80-х и 90-х годов,а качество там тушите свет!Там всё бубнит,всё сыро и глухо,ну вот так раньше записывали,то есть нет там и близко никакого абсолютного качества,поэтому я как-то не заморачиваюсь над этим,а просто получаю удовольствие,я привык к этому и даже полюбил.Более того,никаким аудиофилом я себя не считаю,так как сам слушаю mp3 q0 и мне этого достаточно,пусть и дурят мой мозг,но зато как грамотно! Лично мне не нравится на слух опять же параметр q9,но q9 будет близок тогда к абсолютному качеству теоретически,просто вырежет кое-чего да и все дела.Вы не электронщик случаем?Потому что такие подходы делают электронщики в основном.В общем-то я могу быть и не прав по поводу q9,но теоретически это так.Ну будет это абсолютное качество,без алгоритмов всяких и психоакустик,но опять же,звучать это будет не лучшим образом.Ведь не даром же говорят и экспериментируют,что q0 - максимально приближённое качество к оригиналу!Да и я вам тоже с уверенностью могу сказать это.Но это опять же я слушал,а не смотрел.В общем я сам себя запутал теперь и вернулся к своим первым фразам,а может и нет. Если вы в этом разбираетесь,то измерьте чем вы там собираетесь мерять,эксперименты - дело хорошее.
В Вашем случае со старыми записями, именно они в данном случае являются единственными истониками абсолютного звука. И задача мп3 сохранить максимум то, что сохранилось до мп3. Вы правильно меня поняли, но путаетесь немного в понятиях объективного существования звука и субъективного восприятия его нами. Стиль музыки тут не важен. Я экспериментировал и на электронной и на классической музыке. Важен лишь используемый спектр частот. Тут звук либо ПОХОЖ (психологически) на оригинал, либо ИДЕНТИЧЕН (физически) в какой-то степени оригиналу, не путайте. Я измерял и пришел к выводу, что q9 идентичнее, чем q0, хотя, не спорю, q0 похож больше, чем q9 (хотя это слышно только при низких битрейтах). Я все измерил уже, получил выводы. И хотел узнать, есть ли еще у кого такие выводы, чтобы сравнить. Оказалось проблемой даже объяснить суть дела, задачи Мои уши неидеальны, я не слышу разницу между 256 и 320, а вам найду семпл и Вы не услышите разницу между 320 и 128. Это всё давно понятно. Но почему-то никто не анализировал кодек мп3 на предмет физического сохранения оригинала, а ведь он это делает в какой-то степени, хотите Вы этого или нет, понимаете или нет. Я недавно еще провел один тест и получил просто отличный результат. мп3 320 просто идеально сохраняет фортепианную фонограмму. Это основывается на том, что мп3 теряет звук на высоких и чуть низких частотах, в отличии от других кодеров. Полезный сигнал не имеет частот в столь широком диапазоне. Просто попробуйте послушайте потерьный файл. Там просто шум на уровне -60Дб, который не несет в себе полезного сигнала. И, если бы, микрофоны не шумели при записи, возможно, мп3 сохранил бы 99.9% абсолютного качества. Здесь он творит чудеса.
В чем преимущество абсолютного качества? В том, что оно не зависит от ушей и способностей человека. Оно просто есть, играет в данной комнате из данных колонок. Даже если в комнате нет слушателя.
Я считаю, абсолютное качество q0 = оригинал минус потери вырезания частот минус потери обработки психоакустики. Абсолютное качество q9 = оригинал минус потери вырезания частот.
Учитывая что потери обработки психоакустики не могут быть равны нулю, то абсолютное качество q9 всегда больше абсолютного качества q0. То есть q9 ближе к оригиналу, чем q0 физически. Как Вам такие антинаучные методы? И ведь приборы это подтверждают. Я хотел, чтобы это или опровергли или подтвердили. Но меня просто не поняли.
Аналогично, возьмите зашумленный изначально оригинал (с магнитной ленты). Ну вот нету у нас чище оригинала, чем этот. В данном случае, он является эталоном, творцом звука. Он- нулевая точка системы отсчета нашего абсолютного качества.
Возьмите его сохраните в WAV. Скопируйте, чтобы получить два идентичных файла. Один пропустите через супер-пупер шумоподавитель. Получим два файла. Один будет иметь качество оригинала минус потери при оцифровке звука. А второй будет иметь качество оригинала минус потери при оцифровке, минус потери при шумоподавлении. Что скажут нам слушатели? Конечно, что с шумодавом звучит намного лучше (тот самый q0). А что звучит ближе к оригиналу физически? Конечно, без шумодава. Там синусоида будет куда более похожа на синусоиду оригинала, нежели WAV после шумодава. Так вот, отсюда два вида качества: воспринимаемое и абсолютное. Две может быть задачи - сохранить максимум воспринимаемого качества или максимум абсолютного качества. Я надеюсь, уже даже все домохояйки поняли, о чем идет речь Больше я не знаю как объяснить!
Так что кодируйте q0, если хотите максимум воспринимаемого качества. И кодируйте q9, если хотите максимум абсолютного качества. Лично я этим интересовался ради интереса собственно и кодирую q3, дабы иметь компромисс между шумом q9 и "клюканьем" q0.
ps сайт уже не открывается, он выдержал натиска мысли))
Я понял ход вашей мысли,причём на все 100%.Но вы так сильно не держитесь за своё мнение,потому что не факт,что это так,вы же только предполагаете,а не утверждаете,налетят ребята и опровергнут ваше мнение,ещё и с кулаками налетят. Я так пишу,потому что лично я,например,не знаю,как оно на самом деле,правы ли вы или нет,и я за себя не знаю,прав ли я сам.Я поделился своим мнением по этому поводу,но я никак в этом не разбираюсь профессионально,даже не учил,я,скажем так,верхушек нахватался. Знаю кое-чего,что мне интересно было когда-то и для чего-то,сейчас просто использую некоторые знания в некоторых целях собственных,не более.А то,о чём мы тут толковали...Не знаю,правы мы или нет.Один только факт могу сказать,что я вас понял,что вы имели ввиду.Ну в общем-то,если вы нашли компромисс себе,то,наверно,конец темы,вот только ждать от кого-то чего-то стоит,а именно истины по этому вопросу,правы ли мы в теории по поводу q9 и q0 в плане абсолютного качества.По крайней мере и я буду знать,это как минимум интересно.Хочется просто послушать мнение других людей.Сам-то останусь на своём любимом, VBR Q0.
Я согласен с Вами полностью. Я тоже этим не занимаюсь и, если придется, буду слушать мп3 128 и не умру. Вся эта задача стояла только как развлечение и тренировка мозга. За ребятами, которые разнесут мою теорию я и пришел сюда Но нет, так нет. Пусть останется моим предположением. По поводу VBR, Вы хотели сказать V0, наверное? С точки зрения абсолютного качества, он заметно уступает CBR320 с любым q. Об этом говорит и размер файла. А как с воспринимаемым качеством, не заморачивался, но, думаю, оно на высоте. Считаю, V0 и другие уровни имеет смысл использовать, если хоть как-то важно место на диске. Если нет - CBR320. Опять же по абсолютным показателям. А по суъективным - каждый выбирает себе. У меня вот есть обычный бумбокс, который понимает лишь 999 файлов на флешке. Если флешка 16Гб, то 999 набирается быстрее, чем кончается место на диске. Учитывая, что он понимает только мп3, кодировать можно смело в 320, т.к. место вольное.
С точки зрения абсолютного качества, он заметно уступает CBR320 с любым q.
Теоретически-да.Не спорю.Но в плане разумного использования битрейта,размера и качества на слух - великолепный результат.Очень в редких случаях уступает cbr,можно где-то на доли секунде найти бяку,которой в cbr не будет.Но это 1 милипроцент из ста,к тому же vbr нынче актуален и развивается не плохо,да и звучит весьма недурно.Но это только с точки зрения воспринимаемого качества.В общем разницу я не слышу между флак и vbr v0,особенно когда не вслушиваюсь умышленно,а если и услышу разницу,то она настолько мала,что я забиваю на неё,но это когда вслушиваешься,а так,когда просто слушаешь в удовольствие и ни о чём не думаешь,то всё звучит идеально!Вот такая вот у меня история с этим.И это правильно,я считаю.Надо расслабиться и просто слушать,улавливать музыку,а не артефакты. Чего и всем желаю.
Правильно думаете, слышимые искажения современных форматов просто нечтожны, по сравнению с аналоговыми возможностями звукозаписи прошлых лет (хоть некоторые и ненавидят цифровой звук до сих пор).
Я тоже, думаю, не услышу разницы между V0 и флак. Я тоже с удовольствием слушаю мп3 320 или V0, хотя даже знаю, что там немного порезан звук. Есть принципы разумной достаточности и они здесь работают. С точки зрения абсолютного качества существует нынче флак и аналоги. Просто есть практичные задачи, чтоб удовлетворить слух, а есть абстрактные задачи, чтоб передать звук. Конечно, с помощью мп3 вторую задачу решать глупо. Но ведь ответ есть и я хотел его найти. мп3 очень интересен массовой поддержкой где только это возможно. Скажем спасибо компаниям Сони и Филлипс, что они в погоне за деньгами подарили нам цифровую звукозапись со всеми ее возможностями
Провел множество тестов кодека lame на предмет потери качества в максимальном битрейте. Способ применял описанный на сайте - получение разностного сигнала между оригиналом и конверсией. Только анализировал не только амплитудные показатели разности, но и спектральные. То есть, не только сила потерь, но и что именно теряем. Кстати, аналогично ранее установил, что мп3 в районе средних и низких куда лучше сохраняет звук, чем даже OGG при битрейте 500.
Меня интересует, что думает автор статей о ключах -q9 и -q0 при максимальном битрейте -b 320. Везде указывается, что нужно устанавливать -q0 для максимального качества. А вот по результатам тестов я получаю как раз обратную картинку. При -q0 разница получается зажеванная, погрызанная частотно, а при -q9 потери получается в виде шума, равномерные по частоте, по амплитуде аналогичные -q0 (даже чуть меньше). Может все-таки лучше отключать все маскировочные функции кодека при максимальном битрейте? Тогда искажения носят более линейный характер по спектру. Мне кажется, на максимальном битрейте все умные штуки -q0 только вносят больше потерь и удаляют сигнал от оригинала. Если интересно, могу выслать семплы с результатами.
Хотелось бы услышать хотя бы субъективное мнение другого человека.
Ответ: Зря теряете время. Чем заниматься подобными антинаучными исследованиями и усугублять без того плачевное положение в массах - займитесь лучше чем нибудь полезным.
Анализ качества невозможен без использования психоакустики. Лучше чтобы использовались человеческие уши. Без участия глаз.
Большое спасибо за развёрнутый ответ! Я и сам уже предположил, что алгоритм просто убирает ненужную невоспринимаемую информацию, но хотелось убедиться, что понял правильно. Ещё раз спасибо!
Я не утверждаю, что "красивая" спектрограмма является гарантом качества. Мне как раз таки хотелось бы разобраться, о чём (в качественном плане) можно по ней судить. Просто подозреваю, такие не особо соображающие в этом как я, видят, что у lossless спектр весь "заполненный", и поэтому для lossy делают вывод (я так понимаю не верный) - чем насыщеннее спектр, тем круче. Хочется знать - где правда, а где заблуждение. Надеюсь на подробный, по возможности, ответ или ссылку на разъяснение. Заранее спасибо!
Ответ: О спектрограмме можно судить о ширине спектра и о распределении мощности сигнала в полосе частот. "Качество звука" - понятие субъективное и какими-то объективными методами его в полной мере оценить невозможно. Так как кодеры выполняют кодирование с учетом особенностей человеческого слуха (ограниченность сверху диапазона воспринимаемых частот - это лишь часть - еще есть частотная, временная маскировка), то и оценивать результат надо только на слух. А корреляция красоты картинки и воспринимаемого качества имеет место далеко не всегда.
Почему более редкий спектр при более высоком качестве алгоритмов - да потому что при этом выполняется поиск частотных составляющих, который не будут восприниматься слухом, их удаление, а освободившиеся биты пускаются на повышение качества кодирования воспринимаемых составляющих.
Прошу прощения, но вариант "послушать" меня не устраивает, да и попросту не подходит в данный момент из-за акустики. Мне хотелось бы, очень грубо говоря, научного обоснования.
Я слушал два варианта одной и той же композиции. Там, где спектрограмма насыщеннее - звучит лучше.
Я не объясняю никаккую точку зрения. Это наблюдения(факты).
Значит по вашим наблюдениям должно получаться, что при кодировании с ключом -q 9 качество лучше, чем с ключом -q 0. Ведь, как я уже писал, на -q 9 спектр насыщеннее в диапазоне 16 - 20,5 kHz. Но лучшим то является -q 0. Где же правда?
Я поэкспериментировал с ключами и, как мне показалось на слух и по спектрограмме, получается самое лучшее качество и кодирование происходит быстрее. Ключи:
-V0 -b320 -B320 -m j -q0 --noreplaygain.
Попробуйте.
Лучше по сравнению с ключами, которые дают постоянный битрейд 320
Или что означает "Установить ширину фильтра низких частот"?
ключ "--lowpass-width".
Допустим частота фильтра задана --lowpass 22. Значит частоты выше 22 кГц будут обрезаны. А --lowpass-width 30. Это значит 30% от 22кГц = 6600.
Вопрос: Что будет происходить в полосе частот 15400 - 22000?
Или я всё не так понимаю?
1) почему насыщенность спектрограммы возрастает в сторону -q 9, а не -q 0? Разве не должен спектр быть более "красивым" на меньших значениях ключа -q, т.е. на большем качестве алгоритма?
2) опять же, в 3.99.3 спектр на -V 0 выглядит насыщеннее, чем на -b 320 -q 0, и срез в VBR на 22.1 kHz, а в CBR на 20.5 kHz. Отсюда вопрос: не стал ли алгоритм VBR V0 в 3.99.3 лучше, чем CBR 320 q0?
Ответ: С каких пор спектрограмма является показателем качества? Это главное и самое глупое заблуждение среди нынешних "энтузиастов".
А что означает "Установить ширину фильтра высоких частот"?
ключ "--highpass-width". В кГц.
Допустим частота фильтра задана --highpass 0,02. Значит частоты ниже 20 Гц будут обрезаны.
Ответ: Это ширина среза. Чем она меньше - тем более крутой спад АЧХ в области граничной частоты.
Вопрос: в чем разница между режимами --vbr-mt и --vbr-new? И лучше ли он режима --vbr-old?
Ответ: --vbr-old/--vbr-new - это ключи, включающие более старый или экспериментальный новый режимы кодирования VBR в некоторых версиях LAME. VBR MT - это последний алгоритм, используется в 3.99 по умолчанию. Естественно, он лучше предыдущих.