MTS AI научила Cotype Lite общаться на татарском языке

fgfg Picture

MTS AI разработала новую версию большой языковой модели Cotype Lite для работы с текстами на татарском языке. Компания показала новую версию своей большой языковой модели Cotype на форуме Kazan Digital Week, который прошел в столице Татарстана с 9 по 11 сентября. LLM способна обрабатывать документы объемом до 8 тысяч токенов (примерно 5 листов A4), извлекать и суммаризировать данные за несколько секунд.

Cotype Light может использоваться в архивах, библиотеках, в государственных и частных организациях — везде, где есть потребность в обработке информации и анализе документов на татарском. Например, с помощью большой языковой модели можно ускорить обработку заявлений в государственные органы. Cotype извлечет ключевую информацию, такую как тематика запроса, местоположение и личные данные заявителя, и передаст их в соответствующую базу данных. Как и другие модели семейства Cotype, эта версия может устанавливаться в контуре организации, что позволяет исключить утечки информации.

«Создавая большую языковую модель на татарском, разработчики MTS AI преследовали несколько целей. Во-первых, мы хотели поддержать многообразие языков, существующих в России, помочь им развиваться и быть востребованными в цифровую эпоху. Во-вторых, этот проект показал, что мы умеем адаптировать наши модели под любые научные и бизнес-задачи, в том числе и такие нетривиальные как обработка информации на языках народов России», — сказал исполнительный директор MTS AI Дмитрий Марков.

Чтобы модель Cotype Light смогла понимать незнакомый язык, разработчики собрали датасет и перевели его с русского на татарский. После все данные и ответы модели проверили специалисты-тюркологи и носители языка.

По словам разработчиков, Cotype Light входит в число лучших LLM в своем классе: она содержит 8 млрд. параметров. При необходимости MTS AI может создать LLM на татарском с большим количеством параметров — до 70 млрд параметров, а также большим контекстным окном до 32 тысяч токенов, — чтобы модель умела выполнять такие задачи как перевод и генерация длинных текстов. Также компания MTS AI готова адаптировать модели семейства Cotype для других региональных языков России.

Новости
Главное за последнее время
Смотреть все
Технологии
MWS AI выпустила первую мультимодальную модель для работы с изображениями и текстом
Технологии
MWS AI выпускает открытого ИИ-ассистента для программистов
Исследования
MWS AI выпустила первый бенчмарк для оценки качества VLM, работающих на русском языке
Партнерства
MWS AI и DIS Group заключили технологическое партнерство
Исследования
Опрос MWS AI и X5: каждый десятый житель Татарстана использует генеративный ИИ ежедневно
Исследования
Опрос MWS AI: 25% студентов признались, что пользовались нейросетями на экзаменах
Исследования
Исследование MWS AI: Как россияне используют ИИ на работе
ВобъективеИИ
«Клод» с 1 млн токенов контекста и новая ИИ-модель для роботов 
ВобъективеИИ
Новые открытые модели OpenAI и опенсорсный Grok 2 
MWS AI в медиа
«МТС Банк» улучшает качество обслуживания клиентов с помощью ИИ
ВобъективеИИ
Математические достижения ИИ и сохранение сов