Audiophile's Software
  • Страница 1 из 1
  • 1
Модератор форума: mrmerak, krivenchenko  
Форум » Программы » Программы для работы с музыкальными файлами » Программы для анализа звуковых файлов
Программы для анализа звуковых файлов
Иннокентий
Группа: Проверенные
Сообщений: 2
Статус: Оффлайн
Здравствуйте!

Я плохо разбираюсь в программах по анализу звука, но в Интернете не
нашел не одной стоящей вещи, которая мне требуется. Прошу Вас помочь
мне.

Проблема в том, по роду своей работы, мне требуется прослушивать записи
интервью (работаю в исследовательской компании, где часто приходится проверять записи интервью с людьми). Очень часто попадаются "пустые" файлы, то есть на записи никто
никого не опрашивает (нет голосов), и там слышно только фоновый звук.
То есть для меня это значит, что интервьюер никого не опрашивал, а
самостоятельно заполнял анкету, что является браком. Таких записей у
меня бывает несколько сотен, и проверять все нет возможности.

Поэтому хотел спросить у Вас, если программы, которые могли определить
автоматически, что файл "пустой", там нет голосов?

В интернете я находил несколько программ, но фоновый шум они определяют как звук, и это вводит в заблуждение: сложно понять, разговаривают ли реально люди или это просто фоновый шум (например, если опрашивают на улице, то в качестве фона могут быть звуки машин, проходящих людей и т.д.)


Спасибо!
Audiophile
Группа: Администраторы
Сообщений: 1236
Статус: Оффлайн
Теоретически, если шум равномерный, без всплесков, то можно такую программу написать. Но если периодически проезжает например одна машина - задача уже становится сложной, т. к. нужен очень детальный спектральный анализ, и нужно знать, что ищешь - какие у человеческого голоса характеристики и т. д.

Практически уверен, что такой программы в публичном доступе нет.
mpuzirew
Группа: Проверенные
Сообщений: 238
Статус: Оффлайн
В порядке бреда - по идее, такой "пустой" файл от файла с речью должен заметно отличаться по спектрограмме. Проверил файл в spek, и сразу видно, если он "подозрительный". Отпадает необходимость прослушивать весь материал. Не полная автоматизация, но хоть какая-то.
Иннокентий
Группа: Проверенные
Сообщений: 2
Статус: Оффлайн
З
Цитата Audiophile ()
Теоретически, если шум равномерный, без всплесков, то можно такую программу написать. Но если периодически проезжает например одна машина - задача уже становится сложной, т. к. нужен очень детальный спектральный анализ, и нужно знать, что ищешь - какие у человеческого голоса характеристики и т. д.Практически уверен, что такой программы в публичном доступе нет.
Спасибо большое за ответ! Фоновый шум может быть разным, это может быть музыка в торговом центре, либо посторонние разговоры мимо проходящих людей. И это как раз осложняет анализ таких звуковых файлов через программы спектрального анализа.

Цитата mpuzirew ()
В порядке бреда - по идее, такой "пустой" файл от файла с речью должен заметно отличаться по спектрограмме. Проверил файл в spek, и сразу видно, если он "подозрительный". Отпадает необходимость прослушивать весь материал. Не полная автоматизация, но хоть какая-то.

Спасибо за ответ! Попробую провести тест наших файлов на этой программе
mpuzirew
Группа: Проверенные
Сообщений: 238
Статус: Оффлайн
Цитата Иннокентий ()
Попробую провести тест
Spek встраивается в контекстное меню проводника и поддерживает драг-н-дроп, так что работать с большим количеством файлов должно быть более-менее удобно. Для улучшения читаемости спектра достаточно развернуть окно на весь экран.
DJ_Master_Phil
Группа: Проверенные
Сообщений: 3
Статус: Оффлайн
О. Класс! Как раз то, что я искал
Тело не упадёт, если сохранить скорость
artenoxm
Группа: Проверенные
Сообщений: 9
Статус: Оффлайн
PlotBitrate - программа для просмотра графика битрейта. Аналог Bitrate Viewer, только для звука (видео, впрочем, тоже умеет, но разделяет на IPB кадры).
https://github.com/zeroepoch/plotbitrate
Использование
plotbitrate.py -s audio input.mkv

Работает под Linux (не знаю насчет Windows), его всегда можно поставить в виртуалку. Для Ubuntu нужно предварительно установить sudo apt install ffmpeg python3-matplotlib python3-matplotlib-venn
plotbitrate.py желательно переименовать в bitrate, сделать исполняемым chmod +x bitrate и поместить в /home/user/.local/bin тогда можно вызывать из терминала
bitrate -s audio input.mkv
или
bitrate -s audio input.mp3
весь файл декодируется и открывается svg картинка с битретом, которую можно масштабировать.
Скриншоты:
VBR
https://img16.lostpic.net/2020/01/11/24c0ee3c78c886ab0bc2351fedc4b21a.png
CBR
https://img15.lostpic.net/2020/01/11/9230a3cf9116ad330c908cbb2e600c25.png
Прикрепления: 0504892.png(37.4 Kb) · 2705893.png(30.4 Kb)
Сообщение отредактировал artenoxm - Суббота, 11 Января 2020, 12:32
m14u
Группа: Проверенные
Сообщений: 45
Статус: Оффлайн
Цитата artenoxm ()
PlotBitrate
эта программа явно не любит musepack...
artenoxm
Группа: Проверенные
Сообщений: 9
Статус: Оффлайн
Цитата m14u ()
эта программа явно не любит musepack
Обычно в таких случаях я бы порекомендовал перепаковать в mka с помошью ffmpeg -i input -c copy -vn -sn output.mka (файлы можно перетаскивать в терминал) или MKVToolnix, но оказалось ни одна программа не в состоянии упаковать musepack (mp+) в Matroska. Хотя, даже с wma это возможно. В принципе, графики там примерно правильные, только значения нужно умножать на 2. Выборка только очень редкая, как я понял.
Под виндой PlotBitrate завести, наверное, можно. Нужно поставить Python 3.8, ffprobe.exe из пакета ffmpeg куда-нибудь в PATH (C:\Windows, например), pip, через pip поставить matpolib. Но это такой гемор, что я не осилил.
Сообщение отредактировал artenoxm - Суббота, 18 Января 2020, 19:14
m14u
Группа: Проверенные
Сообщений: 45
Статус: Оффлайн
Цитата artenoxm ()
В принципе, графики там примерно правильные,
я про "затухание" битрейта к концу графика. подобная картина на всех моих mpc-файлах.
Прикрепления: 2024524.png(36.1 Kb)
artenoxm
Группа: Проверенные
Сообщений: 9
Статус: Оффлайн
Цитата m14u ()
я про "затухание" битрейта к концу графика
Не замечал такого на своих. Видимо от кодера зависит.
MPC Encoder 1.30.1 --stable-- © 1999-2009 Buschmann/Klemm/Piecha/MDT
Built Jan 27 2015 19:11:53
Или от версии ffmpeg
ffmpeg version 2.8.15 Copyright © 2000-2018 the FFmpeg developers
built with gcc 5.4.0 20160609
Xubuntu 16.04
preset --insane (на скрине)
Прикрепления: 9369200.png(42.9 Kb)
Сообщение отредактировал artenoxm - Воскресенье, 19 Января 2020, 05:32
m14u
Группа: Проверенные
Сообщений: 45
Статус: Оффлайн
такой "косяк" начинается с версии ffmpeg 3.4.2 (из доступных на сайте ffmpeg-linux-static).
artenoxm
Группа: Проверенные
Сообщений: 9
Статус: Оффлайн
m14u
Да, я тоже заметил, когда обновил ffmpeg до 4-ой версии.
Для musepack имеет смысл поставить Ubuntu 16.04.
Старые версии ffmpeg работают корректнее с musepack, но все равно все значения надо умножать на 2.

Если пользуетесь Ubuntu 18.04 можно старый static бинарник ffprobe подложить в ~/.local/bin
Сообщение отредактировал artenoxm - Среда, 22 Января 2020, 14:17
Форум » Программы » Программы для работы с музыкальными файлами » Программы для анализа звуковых файлов
  • Страница 1 из 1
  • 1
Поиск: