Audiophile's Blog
Логин:Пароль:


Забыл пароль | Регистрация (убрать всю рекламу)
На сайт | Новые сообщения | Участники | Правила форума | Поиск | RSS
» » » »
Страница 1 из 11
Модератор форума: mrmerak, krivenchenko 
Форум » Кодирование аудио » Консольные кодеры » Кодирование аудиолекций (советы по настройкам)
Кодирование аудиолекций
ytka00Дата: Суббота, 31 Января 2015, 13:49 | Сообщение # 1


Группа: Проверенные
Сообщений: 4
Статус: Offline
Возникла необходимость закодировать много аудиолекций для прослушивания на телефоне. Материал местами записан на улице (присутствуют посторонние шумы) или просто в помещении поэтому при сжатии на низких битрейтах звучит гораздо хуже чем чистый голос (например аудиокнига). Хотел бы закодировать в HE AAC 16-24 килобит (чем меньше тем лучше т. к. лекции длинные). Есть ли возможность выделить только голосовой диапазон? Пробовал кодировать с эквалайзером с убавлением частот после 3,5 килогерц, т. к. частота человеческого голоса до 3400 герц как пишет вики. Но звук получается глухим по сравнению с оригиналом, особенно слышно на звуках ц и с. Может ктото сталкивался с похожей задачей или есть какиенибудь мысли?
 
UserДата: Суббота, 31 Января 2015, 14:22 | Сообщение # 2


Группа: Проверенные
Сообщений: 120
Статус: Offline
Цитата ytka00 ()
Может ктото сталкивался с похожей задачей или есть какиенибудь мысли?
Я просто взял MicroSD на 64 ГБ.

Цитата ytka00 ()
Есть ли возможность выделить только голосовой диапазон?
За просто так играясь с частотами - вряд ли. Какой-то фон всё равно будет.

Цитата ytka00 ()
Пробовал кодировать с эквалайзером с убавлением частот после 3,5 килогерц, т. к. частота человеческого голоса до 3400 герц как пишет вики.
Смотря как говорить. Если не запамятовал, то голос идёт вплоть до 10 кГц. Хороший пример делает сталкер на своём видео. Посмотрите пару минут и сами поймёте, до куда может идти голос.


Стандарт качества - 44100 кГц, 16 бит хватит для всех. Однако никто не затачивал музыку под ваше воспроизводящее оборудование и под ваши вкусы.

Сообщение отредактировал User - Суббота, 31 Января 2015, 14:22
 
mpuzirewДата: Суббота, 31 Января 2015, 14:39 | Сообщение # 3
Группа: Проверенные
Сообщений: 186
Статус: Offline
ИМХО:
Выделять голосовой диапазон простым обрезанием - плохая идея. Можно как здесь http://pcnotes.ru/soft....udacity , но учитывая большой объем информации, это долго и неудобно, и качество будет гадательное, лучше найти способ обойтись вообще без обработки. Думаю, какой-нибудь Fraunhofer HE-AACv2@32 звучал бы вполне приемлемо. Если такой вариант по качеству не устраивает, я бы попробовал downmix to mono -> resemple to 22050 -> обычный Low Complexity AAC. Тут экспериментировать надо, от материала зависит.

P.S. Учтите, что в foobar'e Fraunhofer (по крайней мере, у меня) категорически не дружит с ресемплерами и прочими предпроцессорами, выдает ошибку. В варианте "downmix to mono -> resemple to 22050 -> обычный Low Complexity AAC" лучше использовать кодер от Nero или Apple. Сами кодеры можно взять здесь http://audiophilesoft.ru/load/coders_utils/7 , там же примеры настроек и ссылки на полный список параметров.


Сообщение отредактировал mpuzirew - Суббота, 31 Января 2015, 16:00
 
Horizon-4Дата: Суббота, 31 Января 2015, 17:44 | Сообщение # 4
Группа: Проверенные
Сообщений: 91
Статус: Offline
3,4 кГц - это основные тона диапазона человеческого голоса, но ещё есть гармоники, в акустике они называются обертонами. Обертоны помимо прочего определяют тембр голоса со всеми его индивидуальностями. Если резко ограничить полосу частот, пропадёт чёткость, разборчивость речи и т. п. Для нормальной передачи речи, скорее всего, будет достаточен диапазон 80-10000 Гц со спадом АЧХ ниже 80 Гц и выше 10 кГц крутизной 9-12 дБ/окт. Для обработки речи подойдёт компрессор, который слабые звуки будет усиливать, а сильные - ослаблять, при этом уменьшится динамический диапазон (можно задать). Также при необходимости можно применить шумоподавление. Есть, если не ошибаюсь, редактор Diamond Cut Forensics Audio Laboratory, который хорошо обрабатывает проблемные речевые сигналы (файлы). Что касается битрейта выходного файла, то, наверно, лучшим вариантом будет 96-128 kbps, частота дискретизации - достаточно будет 22 кГц. Кодек - по моим ощущениям луший сжатый звук дают AAC и Vorbis OGG, для речи и МР3 неплохим будет. Битрейт в 16-24 kbps всё-таки и для речи маловат будет.
 
mpuzirewДата: Суббота, 31 Января 2015, 23:43 | Сообщение # 5
Группа: Проверенные
Сообщений: 186
Статус: Offline
Цитата Horizon-4 ()
лучшим вариантом будет 96-128 kbps,
Имхо, для речевого сигнала, да в моно, да с частотой дискретизации 22, это перебор (имея в виду реальный битрейт, а не тот примерный, который, к примеру, отражается в настройках конвертера foobar - он для 44.1 stereo).

Цитата Horizon-4 ()
Битрейт в 16-24 kbps всё-таки и для речи маловат будет.
А вот с этим полностью согласен. Слишком экстремально.


Сообщение отредактировал mpuzirew - Воскресенье, 01 Февраля 2015, 00:11
 
ytka00Дата: Понедельник, 02 Февраля 2015, 17:23 | Сообщение # 6


Группа: Проверенные
Сообщений: 4
Статус: Offline
Спасибо всем за советы, видимо чудес не бывает), остановился на  HE AAC 32 килобит (на сверхнизких битрейтах LC вчистую проигрывает HE), поиграюсь еще с lowpass filter. Насчет 96-128 килобит это и правда перебор, ведь у меня исходник 96 килобит) а 16-24 могут звучать вполне сносно если звук чистый, ведь в таком материале ценность именно в информации, а не в качестве звучания.

Сообщение отредактировал ytka00 - Понедельник, 02 Февраля 2015, 19:48
 
AudiophileДата: Понедельник, 02 Февраля 2015, 23:22 | Сообщение # 7


Группа: Администраторы
Сообщений: 1052
Статус: Offline
ytka00

http://audiophilesoft.ru/publ....-1-0-83
Цитата
Сверхнизкие битрейты (~25—40 кбит/с)

Этот диапазон неплохо подходит для кодирования аудиокниг, и в данном случае вариант может быть только один — AAC, а точнее, Nero AAC. Параметры следующие:
-lc -q 0.35 -ignorelength -if - -of %d
При этом материал должен быть предварительно преобразован в моно и
ресемплирован до частоты 22050 Гц (желательно ресемплером SoX). На
выходе получим обычное Low Complexity AAC с битрейтом около 25 кбит/с.
 
mpuzirewДата: Вторник, 03 Февраля 2015, 01:08 | Сообщение # 8
Группа: Проверенные
Сообщений: 186
Статус: Offline
Цитата ytka00 ()
остановился на HE AAC 32 килобит (на сверхнизких битрейтах LC вчистую проигрывает HE), поиграюсь еще с lowpass filter.
Играться с lowpass фильтром в данном случае смысла нет, по-моему. Ведь HE-AAC предполагает математическое "псевдовосстановление" высоких частот при воспроизведении, а на этапе кодирования они и так ограничиваются, для экономии битрейта. Зачем резать то, что кодер сам обрезает? 
По поводу совета по ссылке, которую дает Audiophile. Для аудиокниг (чистого голоса) это подойдет, я пробовал, но (при всем уважении) не уверен насчет более сложных записей с посторонними шумами. Думаю, все-таки AAC-HEv2@32 - действительно, самое оно.
 
DiZ91Дата: Воскресенье, 22 Марта 2015, 09:44 | Сообщение # 9
Группа: Проверенные
Сообщений: 5
Статус: Offline
Я в OPUS'е начал всё хранить. Уж очень мне он понравился
 
Форум » Кодирование аудио » Консольные кодеры » Кодирование аудиолекций (советы по настройкам)
Страница 1 из 11
Поиск:

Copyright Taras Kovrijenko © 2009–2016