MTS AI научила Cotype Lite общаться на татарском языке

fgfg Picture

MTS AI разработала новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Компания показала новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week, который прошел в столице Татарстана с 9 по 11 сентября. LLM способна обрабатывать документы объемом до 8 тысяч токенов (примерно 5 листов A4), извлекать и суммаризировать данные за несколько секунд.

Cotype Light может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

«Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России», — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Light смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Light входит в число лучших LLM в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Новости
Главное за последнее время
Смотреть все
Технологии
MTS AI выводит на рынок нового ИИ-ассистента для разработчиков
События
Вебинар «Как бизнесу использовать LLM в 2025 году»
События
Вебинар: как с помощью ИИ защитить бизнес и репутацию от дипфейков
События
Вебинар: разговор на языке данных
ВобъективеИИ
Предсказания Маска и конкуренция на ИИ-поле
Новости команды
MTS AI подписала декларацию об ответственной разработке генеративного ИИ
ВобъективеИИ
Язык дельфинов и самодетоксикация LLM
ВобъективеИИ
ИИ-хакеры и новые конкуренты DeepSeek
Новости команды
Исследование MTS AI: У 70% программистов есть претензии к ИИ-ассистентам для написания кода, но большинство признает их пользу
MTS AI в медиа
Агенты выстраиваются в линейку
Технологии
MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса
MTS AI в медиа
Эксперт рассказал, когда ИИ сможет обрабатывать все медицинские снимки
ВобъективеИИ
Мем-творчество ИИ и риски AGI
Кейсы
Сервис МТС Live подключил нейросеть от MTS AI к генерации описаний для билетной витрины
Решения
Детектор мошенничества в текстовых и голосовых сообщениях