6 сервисов на основе нейросетей для улучшения качества звука

1. Auphonic

Платформы: веб.

Онлайн‑сервис, специализирующийся на инструментах для постпроизводства. Auphonic можно использовать во время обработки материалов в подкастах и видеороликах. В набор доступных алгоритмов входит не только удаление посторонних шумов, но и нормализация громкости и автоматическое выравнивание баланса между разными источниками звука. Например, можно вывести запись речи на удобный для восприятия уровень по сравнению с фоновой музыкой.

Auphonic работает с одиночными файлами, хотя способен и на многодорожечную обработку. При этом для каждой дорожки можно указать пространственную характеристику — должен ли звук быть на первом плане, если это голос, или ему следует оставаться на фоне.

Инструмент также поддерживает добавление метаданных к выходному файлу. В подробностях о записи можно указать авторов, участников записи, название альбома, издателя, тип лицензии, год выпуска, жанр, теги и комментарии.

В настройках обработки можно подключить внешний сервис определения речи. Это пригодится на случай, если вам нужно перенести запись голосов в текстовый формат автоматически. Однотипные параметры получится сохранить в виде шаблона для последующей работы.

Auphonic можно использовать бесплатно, но общая продолжительность обрабатываемых аудиодорожек будет ограничена 2 часами в месяц. Для профессиональной работы придётся подключить подписку стоимостью от 11 долларов в месяц.

Попробовать Auphonic →

2. Audo Studio

Платформы: веб.

Audo Studio похож на предыдущий сервис, но в данном случае фокус именно на фильтрации записи голоса от посторонних шумов. Помимо удаления раздражающего фона инструмент может нейтрализовать эхо и реверберацию звука в помещении, а также выровняет уровень громкости. Для регулировки интенсивности обработки предусмотрен один слайдер.

Готовый результат можно прослушать и быстро сравнить с исходной версией. Обработанный файл легко конвертировать во все популярные форматы аудио: WAVE, AIF, OGG Vorbis, AAC, MP3, M4A.

Бесплатно в Audo Studio разрешается обрабатывать до 20 минут записей в месяц. За 12 долларов лимит расширяется до 10 часов в месяц.

Попробовать Audo Studio →

3. Krisp

Платформы: Windows, macOS.

Krisp работает как дополнительный слой между входящим аудиосигналом с микрофона и приложениями для онлайн‑конференций. Программа нейтрализует эхо, фильтрует шум автомобилей, крики детей, фоновую речь людей, гул вентиляторов, лай собак и прочие звуки, которые могут отвлекать от проведения деловых звонков.

Система автоматически определяет, какое приложение используется в данный момент для звонка, и передаёт в него очищенный звук. При этом можно отфильтровать сигнал не только со своей стороны, но и поступающий шум от других участников разговора. Эта дополнительная функция, конечно, работает только для вашего спокойствия и не может вмешаться в общий звук конференции.

Приложением можно пользоваться бесплатно 60 минут в день, а за снятие ограничения разработчики предлагают оформить подписку стоимостью от 96 долларов в год.

Попробовать Krisp →

4. LALAL.AI

Платформы: веб, Windows, macOS, Linux Ubuntu.

Этот простой сервис с помощью нейросети удаляет фоновые шумы из загруженных на обработку аудиофайлов. LALAL.AI Voice Cleaner предназначен для человеческой речи и выделяет именно голоса в плохих записях. А Stem Splitter умеет разделять музыкальные записи на отдельные группы инструментов и вырезать вокал из песен.

При добавлении файла на очистку от шумов получится настроить только уровень фильтрации — мягкий, нормальный или агрессивный. В бесплатном режиме LALAL.AI обработает только 10 минут аудио размером до 50 МБ. Для тех, кто занимается улучшением записей регулярно, предусмотрены платные тарифы: 15 долларов за 90 минут и 25 долларов за 350 минут.

Попробовать LALAL.AI →

5. Adobe Enhance Speech

Платформы: веб.

В Adobe Enhance Speech нет никаких настроек. Нейросеть нейтрализует эхо и удаляет большинство посторонних шумов автоматически. Можно загрузить файл продолжительностью до часа и размером до 1 ГБ, а потом сравнить исходную запись с отфильтрованной.

Если голос записан слишком тихо по сравнению с окружающими звуками, то часть слов может пропасть после обработки. Enhance Speech не только уменьшает количество шумов, но и перестраивает саму речь, чтобы повысить её чёткость.

Алгоритм неплохо справляется с английским языком, а вот в других случаях происходит забавная ситуация. Например, русский может звучать так, будто человек говорит с американским акцентом. Эти странности проявляются не на всех словах, но стоит помнить о такой особенности сервиса.

На данный момент Enhance Speech в составе набора Adobe Podcast доступен бесплатно.

Попробовать Adobe Enhance Speech →

6. Audio Noise Reducer

Платформы: iOS, Android, веб.

Мобильное приложение позволяет на ходу записывать голосовые заметки или даже подкасты. Кроме того, в программу можно загрузить уже готовый файл весом до 50 МБ для обработки. Audio Noise Reducer неплохо справляется с фильтрацией фоновых шумов, причём работает не только с аудио, но и с видео.

Audio Noise Reducer доступно бесплатно, но с рекламой. Её можно убрать подпиской за 269 рублей в неделю, 890 рублей в месяц или разовым взносом 3 090 рублей. В эту стоимость также входят дополнительные форматы для сохранения.

Подавление звука и рекордер

Inverse.AI

Цена: Бесплатно