Научные исследования MWS AI 2025 года, которые стоит изучить

fgfg Picture

В 2025 году ученые MWS AI вместе с коллегами по рынку выпустили более 20 научных исследований, многие из которых были представлены на таких влиятельных конференциях, как NeurIPS, EMNLP, ECIR и ACL. Безусловно, все они полезны и вносят существенный вклад как в улучшение функционала и эффективности наших ИИ-продуктов, так и в технологический прогресс в целом. Мы попросили авторов самостоятельно выбрать для этого дайджеста по итогам года те исследования, которые интересны с точки зрения влияния на бизнес, но мы о них ранее в наших выпусках #ВобъективеИИ не рассказывали. 

AI-focused digest – новости ИИ-сферы

Выпуск № 74, декабрь 2025

Итеративное самообучение для генерации кода 

Исследование посвящено улучшению ИИ-генерации кода. Авторы разработали итеративный подход к самообучению, базирующийся на двух моделях – генераторе и верификаторе. Верификатор помогает обучить генератор создавать более качественный код. Сначала верификатор размечает код от генератора, а потом дообучается на размеченном, и так несколько раз. Благодаря такому подходу LLM на 13 млрд параметров генерирует код лучше, чем модель в 2,5 раза крупнее, и работает втрое быстрее. Это значит: меньше затрат на мощные сервера, быстрее разработка софта. 

Будет ли это правдой завтра? 

ИИ часто ошибается в ответах на вопросы вроде «Кто мэр Атланты?», потому что данные устаревают. Для решения этой проблемы ученые создали датасет EverGreenQA (33 тысячи вопросов на 7 языках), в котором вопросы промаркированы как evergreen или mutable в зависимости от того, ответы на них «неизменные» (типа температура кипения воды) или «меняющиеся» (например, показатели инфляции). Используя EverGreenQA, они проверили, как темпоральность вопросов определяют 12 современных LLM, а еще разработали легковесный многоязычный классификатор – EG-E5, который продемонстрировал лучшие результаты в этой задаче. Исследование ценно для бизнеса, так как позволяет разрабатывать более точные ИИ-системы и бороться с галлюцинациями. Читать

Адаптивный RAG, независимый от LLM

Большие языковые модели склонны ошибаться из-за галлюцинаций. Генерация с поиском во внешних данных (RAG) помогает это минимизировать, но требует постоянных обращений к внешним источникам, что дорого. Адаптивный поиск решает задачу, извлекая информацию из внешних источников только при необходимости. Однако существующие методы полагаются на оценку неопределенности на основе больших языковых моделей, а это высокие вычислительные затраты. Авторы статьи предлагают подход, полностью независимый от LLM. Вычислений значительно меньше, потери в точности нет. Для бизнеса: дешевле работа чат-ботов, быстрее отклик, проще масштабирование.

CCT-Code: кросс-консистентное обучение для обнаружения клонов и поиска кода

Статья посвящена обучению ИИ находить похожий код – даже на разных языках программирования (Python → Java). Это помогает в рефакторинге и поиске ошибок, что положительно сказывается на скорости разработки в больших проектах. Авторы разработали процедуру обучения CCT (кросс-консистентное обучение), которая направлена на то, чтобы модель «улавливала» семантику, то есть смысл кода, а не смотрела на его имплементацию, то есть, например, на конкретные названия переменных. Модель учится сравнивать код по смыслу, используя 55 тысяч решений с CodeForces. Благодаря этому подходу получилось добиться рекордной точности обнаружения клонов на C++ и Python. Эффект: экономия времени на унификацию кода в командах с разными стеками.

StRuCom: новый датасет структурированных комментариев к коду на русском языке

Исследовали создали датасет StRuCom (153 тысячи примеров), чтобы обучать ИИ писать качественные структурированные комментарии к коду на русском языке — с описанием параметров, возвратов и ошибок. Данные собраны из русскоязычных GitHub-проектов на Python, Java, JS, C#, Go, также датасет обогащен сгенерированными примерами с последующей ручной проверкой. Результат: дообучение небольших моделей на этом датасете дает +50% качества. Плюсы для бизнеса: автоматическая локализованная документация, меньше ошибок в командах, проще поддержка legacy-кода.

SPY: повышение приватности с помощью синтетического датасета для детекции ПДН

Ученые представляют SPY — новый синтетический датасет и бенчмарк для детекции персональных данных (PII). Ключевая инновация — использование больших языковых моделей для генерации данных, имитирующих реальные сценарии PII. Сравнительный анализ показывает, что специализированные NER-модели демонстрируют ограничения при применении к PII-контекстам. Методология генерации и сам датасет опубликованы в открытом доступе, что способствует дальнейшим исследованиям и разработкам в этой области. Работа подчеркивает важность защиты личной информации в современной обработке данных.

Использование славянского BERT и перевода для классификации техник убеждения

Порой в бизнесе требуется выявлять различные техники убеждения, которые применяют в пропаганде, мошенничестве и пр. Решение этой задачи с помощью ИИ осложняется недостатком обучающих данных и неоднозначностью в их разметке. В этой статье исследователи предложили подход на основе многоязычных трансформерных моделей, в частности XLM-RoBERTa и Slavic BERT. Из-за дефицита размеченных данных для некоторых языков авторы применяют аугментацию обучающих данных за счет переведенных примеров с других языков. Итог: решение вошло в топ-3 на конкурсе Slavic NLP 2025 Shared Task. В бизнесе разработка может иметь приложение в таких задачах, как анализ текстов, модерация контента, выявление манипуляций/мошенничества в коммуникациях.


Новости
Главное за последнее время
Смотреть все
Решения
MWS AI представила платформу для создания корпоративных ИИ-агентов в едином интерфейсе
Технологии
MWS AI разработала новую LLM с продвинутыми агентными навыками
Технологии
MWS AI выпустила первую мультимодальную модель для работы с изображениями и текстом
Технологии
MWS AI выпускает открытого ИИ-ассистента для программистов
ВобъективеИИ
Научные исследования MWS AI 2025 года, которые стоит изучить
ВобъективеИИ
Фейковые цитирования и влияние синтаксиса на ответы ИИ
Исследования
MWS AI выпустила первый бенчмарк для оценки качества VLM, работающих на русском языке
Партнерства
MWS AI и DIS Group заключили технологическое партнерство
ВобъективеИИ
ИИ-мусор на работе и новый метод прунинга
Исследования
Опрос MWS AI и X5: каждый десятый житель Татарстана использует генеративный ИИ ежедневно
Исследования
Опрос MWS AI: 25% студентов признались, что пользовались нейросетями на экзаменах