Методы шумоподавления: обзор от MTS AI

fgfg Picture

Разработчица MTS AI Ольга Яковенко делится обзором, в котором рассказывает о результатах исследования различных подходов шумоподавления для последующего распознавания речи и делится некоторыми находками по теме.

От классики к SotA: методы улучшения речи и шумоподавления

Благодаря процессу шумоподавления можно выделить полезный сигнал из смеси этого самого сигнала и лишнего шума. Например, имеется запись речи человека, а на заднем фоне появляются другие звуки: машины ездят, люди разговаривают, строители меняют асфальт, и так далее. Задача шумоподавления – выделить основную целевую речь среди этого шума.

Ольга Яковенко, разработчица в MTS AI, с командой ASR End2End экспериментируют над различными видами шумоподавления для последующего распознавания речи. В своем обзоре Ольга поделилась результатами исследования существующих подходов шумоподавления, и объяснила, в чем разница между снижением шума при распознавании речи и при улучшении аудио звучания.

Из статьи вы узнаете, как методы улучшения речи используется в нашей жизни и какая существует классификация шумов, в чем отличие традиционных методов шумоподавления от нейросетевых и какие еще прорывные методы и алгоритмы существуют.

Новости
Главное за последнее время
Смотреть все
Технологии
MTS AI выводит на рынок нового ИИ-ассистента для разработчиков
События
Вебинар «Как бизнесу использовать LLM в 2025 году»
События
Вебинар: как с помощью ИИ защитить бизнес и репутацию от дипфейков
События
Вебинар: разговор на языке данных
ВобъективеИИ
Предсказания Маска и конкуренция на ИИ-поле
Новости команды
MTS AI подписала декларацию об ответственной разработке генеративного ИИ
ВобъективеИИ
Язык дельфинов и самодетоксикация LLM
ВобъективеИИ
ИИ-хакеры и новые конкуренты DeepSeek
Новости команды
Исследование MTS AI: У 70% программистов есть претензии к ИИ-ассистентам для написания кода, но большинство признает их пользу
MTS AI в медиа
Агенты выстраиваются в линейку
Технологии
MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса
MTS AI в медиа
Эксперт рассказал, когда ИИ сможет обрабатывать все медицинские снимки
ВобъективеИИ
Мем-творчество ИИ и риски AGI
Кейсы
Сервис МТС Live подключил нейросеть от MTS AI к генерации описаний для билетной витрины
Решения
Детектор мошенничества в текстовых и голосовых сообщениях