Создание аудиокниг из текстовых произведений MTS AI осуществляет на основе возможностей собственной платформы для распознавания и синтеза речи Audiogram. В этом продукте используются нейронные сети, машинное обучение и технологии обработки естественного языка (NLP).
«В перспективе использование технологий синтеза речи позволит издательствам и электронным библиотекам существенного сократить время на подготовку аудиоверсии книги и снизить затраты на производство аудиоконтента. Команде MTS AI удалось добиться того, чтобы на подготовку первоначальной версии аудиокниг уходило 30-60 минут, тогда как студийная запись живым голосом занимает кратно больше времени, до нескольких дней с учетом технической обработки и монтажа», — Дмитрий Буланцев, технический директор MTS AI.
«Формат аудиопотребления книжного контента очень удобен и становится все более популярным. При этом огромный объем книг — более 90% — не озвучены, их трансформация в аудиоформат традиционным способом заняла бы годы. Технологии искусственного интеллекта позволяют существенно ускорить, упростить и удешевить этот процесс. И значит огромное число произведений — как литературных, так и нонфикшн станут доступным в удобном аудиоформате», — комментирует Евгения Рыкалова, руководитель книжного сервиса «Строки» от МТС.
Возможности платформы позволяют не только синтезировать речь, но и правильно расставлять ударения и паузы, воспроизводить интонации, характерные для текстов, в том числе, вопросительные, побудительные.
Книги, озвученные синтезированным голосом, уже доступны в бесплатном каталоге «Строк». Среди них в основном классика российской и зарубежной литературы.
Технология MTS AI для озвучивания текстов и платформа для распознавания и синтеза речи Audiogram может использоваться не только для озвучивания книг, но и в образовательных процессах, в том числе, в EdTech, для подготовки аудиолекций, для озвучивания видео, статей, для создания материалов для людей с ограниченными возможностями, в том числе слабовидящих.