04.07.2025

Новая action-модель и отслеживание мыслей LLM

#ВобъективеИИ возвращается, чтобы порадовать вас новой порцией новостей об искусственном интеллекте перед большими выходными. В этом выпуске: платформа для борьбы с ИИ-галлюцинациями от Themis AI, исследование границ сжатия информации, новая ИИ-лаборатория от Meta*, action-модель от AIRI и инструментарий для отслеживания мыслей LLM от Anthropic.

AI-focused digest – новости ИИ-сферы

Выпуск № 66, 29 мая – 11 июня 2025

Стартап исследователей из MIT учит модели искать ошибки в своих ответах

Стартап Themis AI, основанный исследователями из MIT, разработал новый инструмент для борьбы с галлюцинациями ИИ – платформу под названием Capsa. Ее предназначение – помогать моделям «понимать то, что они не всё понимают», пишет MIT News. То есть выявлять пробелы в знаниях и исправлять ненадежные выходные данные. Как работает платформа, из статьи не очень понятно. Сказано лишь, что она модифицирует модели так, чтобы они могли обнаруживать закономерности в обработке данных, которые указывает на неоднозначность, неполноту или предвзятость. Ждем подробностей.

Anthropic выложила в открытый доступ инструменты для «отслеживания мыслей» LLM

В продолжение темы исследования «мыслительных процессов» LLM. Anthropic на днях открыла для широкого профессионального и научного сообщества инструментарий, позволяющий повторить ранее представленную методологию компании для отслеживания процесса принятия решений в больших языковых моделях. Подход заключается в создании графов атрибуции, частично раскрывающих шаги, которые модель предприняла внутри, чтобы прийти к решению о конкретном выводе. Компания выложила библиотеку инструментов с открытым исходным кодом для создания графов атрибуции на популярных моделях с открытыми весами, а также разместила на Neuronpedia интерфейс, позволяющий исследовать графы в интерактивном режиме. Подробности и все ссылки тут.

Исследователи определили границы сжатия информации для языковых моделей

Ученые из AIRI, МФТИ и Лондонского математического института изучили пределы сжатия для современных LLM, то есть какой объем информации они способны эффективно хранить и обрабатывать внутри себя, сообщает CNews. В своем исследовании они подтвердили, что текст в 1,5 тыс. токенов можно сжать в один вектор. И таким образом книга типа «Хоббит, или Туда и обратно» объемом около 120 тыс. токенов может быть представлена всего в 100–200 векторах, в зависимости от размера модели. Максимально достижимый коэффициент сжатия без потерь обычно не превышает x10, но эта работа показывает, что существуют векторы с коэффициентами сжатия до x1500. На научном исследование описано тут.

Российские ученые представили новую аction-модель Vintix

Еще одна новость от российских разработчиков. Институт AIRI выложил в открытый доступ action-модель Vintix, пишет Forbes. Это тип ИИ-моделей, которые принимают решения о действиях в ответ на информацию из окружающей среды и могут быть использованы в робототехнике и управлении процессами в промышленности. В статье сообщается, что Vintix анализирует в три раза больше информации по сравнению с аналогами, такими как JAT от HugginFace и GATO от Google DeepMind. Модель способна к самокоррекции и самоулучшению, ее архитектура устойчива к шуму и частичной наблюдаемости среды, что делает ее пригодной для промышленного применения.

Meta* открывает новую ИИ-лабораторию

Компания Meta (признана в России экстремистской организацией и запрещена) собирается в ближайшее время запустить новую исследовательскую лабораторию с целью создания суперинтеллекта – ИИ-системы, превосходящей возможности человека.Об этом пишет The New York Times, сообщая также, что к лаборатории присоединится основатель ИИ-стартапа Scale AI Александр Ван. Создание лаборатории – часть усилий Meta* по реорганизации ИИ-ветви бизнеса, которая в последнее время сталкивается с множеством внутренних и внешних вызовов.

*Компания Meta Platforms признана в России экстремистской организацией и запрещена.