MTS AI представила новую версию своей большой языковой модели Cotype для бизнеса — Cotype Pro 2. Новая модель на 40% быстрее предыдущей и на 50% точнее обрабатывает длинные тексты — до 128 тыс. токенов, что соответствует примерно 900 тыс. символов с пробелами. Она адаптирована под выполнение более чем 100 сценариев корпоративных пользователей в России и может быть развернута на собственной инфраструктуре компании без подключения к внешним серверам, что обеспечивает повышенную защиту данных. Модель вошла в пятерку лучших русскоязычных LLM в бенчмарке MERA от Альянса в сфере искусственного интеллекта.
На основе Cotype Pro 2 MTS AI планирует в 2025–2026 годах выпустить новую линейку ИИ-решений для семи отраслей: госсектора, банков, промышленности, ритейла, телекома, медицины и IT. Сначала это будут ИИ-помощники, а затем — ИИ-агенты, сервисы с большей автономностью, которые охватят как общие задачи (HR, клиентская поддержка, документооборот и другие), так и специфичные для каждой из этих отраслей.
«Развитие технологий искусственного интеллекта движется в сторону создания новых архитектур с принципиально другими возможностями. Модели следующего поколения должны не только обрабатывать информацию, но и понимать физический мир, взаимодействуя с ним на более глубоком уровне. Например, они могут анализировать данные из различных источников, таких как системы видеонаблюдения или датчики на производстве, чтобы предсказывать возможные сбои или оптимизировать процессы. Это особенно полезно для компаний, которые хотят предотвратить простои или улучшить эффективность своей работы. Важно также, чтобы ИИ имел „долговременную память“ — мог запоминать предпочтения пользователя и историю общения, чтобы давать более персонализированные ответы. Кроме того, современные модели должны быть способны к более сложному планированию, чтобы эффективно решать многошаговые задачи, такие как управление проектами или координация работы команд», — отметил исполнительный директор MTS AI Дмитрий Марков.
«Ключевым требованием становится развитие способности к рассуждению, что позволит моделям анализировать, делать выводы и принимать обоснованные решения в условиях неопределенности, например, оценивать риски в финансовой аналитике или находить оптимальные подходы в научных исследованиях. Для ИИ-агентов также важно не только хорошо выполнять инструкции и работать с большим объемом информации, но и выдавать ответы в структурированном виде, понятном другим системам. Чтобы оценить качество таких ответов мы разработали специальный бенчмарк. Он включает задания разной сложности и с разным объемом контекста. В нашем тесте Cotype Pro 2 справилась с 94% задач, а GPT-4o — с 93%», — объяснил директор по LLM-продуктам MTS AI Сергей Пономаренко.
MTS AI также разработала собственный метод оценки работы ИИ с длинными текстами, включающий 240 уникальных материалов объемом около 32 тыс. токенов (200 тыс. символов с пробелами). Он показывает, насколько эффективно модель справляется с задачами, требующими одновременного понимания и учета большого объема информации, в том числе из разных источников. Это критический навык для ИИ-агентов, которым необходимо работать с множеством задач одновременно, помнить всю историю их выполнения и учитывать весь контекст общения с пользователем. По замерам на открытом бенчмарке длинного контекста LIBRA, качество работы Cotype Pro 2 выросло вдвое по сравнению с Cotype Pro на задачах длиной 64 и 128 тыс. токенов (до 500 тыс. символов).
Перед выпуском MTS AI в течение трёх месяцев тестировала модель Cotype Pro 2 в реальных условиях: в банке она автоматически сортировала обращения в поддержку, а для МТС Live создавала описания мероприятий. Также в рамках тестирования подтверждена возможность интеграции с инструментами RAG (Retrieval-Augmented Generation) для извлечения информации из баз знаний с генерацией текста. Такие решения востребованы, например, в чат-ботах, где нужно регулярно обновлять данные и отвечать пользователю за несколько секунд.
Cotype Pro 2 значительно превосходит предыдущую модель в ряде задач. Например, в области генерации идей её эффективность возросла с 44% до 57%. В задаче извлечения информации точность повысилась с 81% до 86%, что демонстрирует более качественное выделение ключевых данных. В части общения на общие темы модель улучшилась с 55% до 64%, обеспечивая более плавное и осмысленное взаимодействие. При этом эффективность в классификации осталась стабильно высокой — 87%. Улучшения в суммаризации (с 79% до 85%) и креативном письме (с 61% до 65%) также подчеркивают более развитые навыки обработки текстов и создания содержательных творческих материалов. Для оценки эффективности сравнивалось количество ответов, схожих или превосходящих по качеству ответы модели GPT-4o.
Помимо базовых функций (суммаризация, классификация, рассуждение, математика и логика), Cotype Pro 2 поддерживает «ролевой отыгрыш» — способность вести диалог от лица конкретного персонажа или специалиста, адаптируя стиль коммуникации под профессию. Это повышает качество взаимодействия в клиентской поддержке, обучении сотрудников и других сферах.