Разработчица MTS AI Ольга Яковенко делится обзором, в котором рассказывает о результатах исследования различных подходов шумоподавления для последующего распознавания речи и делится некоторыми находками по теме.
От классики к SotA: методы улучшения речи и шумоподавления
Благодаря процессу шумоподавления можно выделить полезный сигнал из смеси этого самого сигнала и лишнего шума. Например, имеется запись речи человека, а на заднем фоне появляются другие звуки: машины ездят, люди разговаривают, строители меняют асфальт, и так далее. Задача шумоподавления – выделить основную целевую речь среди этого шума.
Ольга Яковенко, разработчица в MTS AI, с командой ASR End2End экспериментируют над различными видами шумоподавления для последующего распознавания речи. В своем обзоре Ольга поделилась результатами исследования существующих подходов шумоподавления, и объяснила, в чем разница между снижением шума при распознавании речи и при улучшении аудио звучания.
Из