Методы шумоподавления: обзор от MTS AI

fgfg Picture

Разработчица MTS AI Ольга Яковенко делится обзором, в котором рассказывает о результатах исследования различных подходов шумоподавления для последующего распознавания речи и делится некоторыми находками по теме.

От классики к SotA: методы улучшения речи и шумоподавления

Благодаря процессу шумоподавления можно выделить полезный сигнал из смеси этого самого сигнала и лишнего шума. Например, имеется запись речи человека, а на заднем фоне появляются другие звуки: машины ездят, люди разговаривают, строители меняют асфальт, и так далее. Задача шумоподавления – выделить основную целевую речь среди этого шума.

Ольга Яковенко, разработчица в MTS AI, с командой ASR End2End экспериментируют над различными видами шумоподавления для последующего распознавания речи. В своем обзоре Ольга поделилась результатами исследования существующих подходов шумоподавления, и объяснила, в чем разница между снижением шума при распознавании речи и при улучшении аудио звучания.

Из статьи вы узнаете, как методы улучшения речи используется в нашей жизни и какая существует классификация шумов, в чем отличие традиционных методов шумоподавления от нейросетевых и какие еще прорывные методы и алгоритмы существуют.

Новости
Главное за последнее время
Смотреть все
Решения
MWS AI представила платформу для создания корпоративных ИИ-агентов в едином интерфейсе
Технологии
MWS AI разработала новую LLM с продвинутыми агентными навыками
Технологии
MWS AI выпустила первую мультимодальную модель для работы с изображениями и текстом
Технологии
MWS AI выпускает открытого ИИ-ассистента для программистов
Исследования
MWS AI выпустила первый бенчмарк для оценки качества VLM, работающих на русском языке
Партнерства
MWS AI и DIS Group заключили технологическое партнерство
Исследования
Опрос MWS AI и X5: каждый десятый житель Татарстана использует генеративный ИИ ежедневно
Исследования
Опрос MWS AI: 25% студентов признались, что пользовались нейросетями на экзаменах
Исследования
Исследование MWS AI: Как россияне используют ИИ на работе
ВобъективеИИ
«Клод» с 1 млн токенов контекста и новая ИИ-модель для роботов 
ВобъективеИИ
Новые открытые модели OpenAI и опенсорсный Grok 2