Методы шумоподавления: обзор от MTS AI

fgfg Picture

Разработчица MTS AI Ольга Яковенко делится обзором, в котором рассказывает о результатах исследования различных подходов шумоподавления для последующего распознавания речи и делится некоторыми находками по теме.

От классики к SotA: методы улучшения речи и шумоподавления

Благодаря процессу шумоподавления можно выделить полезный сигнал из смеси этого самого сигнала и лишнего шума. Например, имеется запись речи человека, а на заднем фоне появляются другие звуки: машины ездят, люди разговаривают, строители меняют асфальт, и так далее. Задача шумоподавления – выделить основную целевую речь среди этого шума.

Ольга Яковенко, разработчица в MTS AI, с командой ASR End2End экспериментируют над различными видами шумоподавления для последующего распознавания речи. В своем обзоре Ольга поделилась результатами исследования существующих подходов шумоподавления, и объяснила, в чем разница между снижением шума при распознавании речи и при улучшении аудио звучания.

Из статьи вы узнаете, как методы улучшения речи используется в нашей жизни и какая существует классификация шумов, в чем отличие традиционных методов шумоподавления от нейросетевых и какие еще прорывные методы и алгоритмы существуют.

Новости
Главное за последнее время
Смотреть все
Решения
MWS AI представила платформу для создания корпоративных ИИ-агентов в едином интерфейсе
Технологии
MWS AI разработала новую LLM с продвинутыми агентными навыками
Технологии
MWS AI выпустила первую мультимодальную модель для работы с изображениями и текстом
Технологии
MWS AI выпускает открытого ИИ-ассистента для программистов
Кейсы
МТС Банк запустил собственного ИИ-помощника на базе MWS AI Agents Platform
ВобъективеИИ
Научные исследования MWS AI 2025 года, которые стоит изучить
MWS AI в медиа
Интеллектуальная революция: как работать с нейросетями
MWS AI в медиа
Экономика нейросетей
MWS AI в медиа
Рынку не хватает интеллекта
ВобъективеИИ
Фейковые цитирования и влияние синтаксиса на ответы ИИ
Исследования
MWS AI выпустила первый бенчмарк для оценки качества VLM, работающих на русском языке
Партнерства
MWS AI и DIS Group заключили технологическое партнерство