Новая action-модель и отслеживание мыслей LLM

fgfg Picture

#ВобъективеИИ возвращается, чтобы порадовать вас новой порцией новостей об искусственном интеллекте перед большими выходными. В этом выпуске: платформа для борьбы с ИИ-галлюцинациями от Themis AI, исследование границ сжатия информации, новая ИИ-лаборатория от Meta*, action-модель от AIRI и инструментарий для отслеживания мыслей LLM от Anthropic.

AI-focused digest – новости ИИ-сферы

Выпуск № 66, 29 мая – 11 июня 2025

Стартап исследователей из MIT учит модели искать ошибки в своих ответах

Стартап Themis AI, основанный исследователями из MIT, разработал новый инструмент для борьбы с галлюцинациями ИИ – платформу под названием Capsa.  Ее предназначение – помогать моделям «понимать то, что они не всё понимают», пишет MIT News. То есть выявлять пробелы в знаниях и исправлять ненадежные выходные данные. Как работает платформа, из статьи не очень понятно. Сказано лишь, что она модифицирует модели так, чтобы они могли обнаруживать закономерности в обработке данных, которые указывает на неоднозначность, неполноту или предвзятость. Ждем подробностей.

Anthropic выложила в открытый доступ инструменты для «отслеживания мыслей» LLM

В продолжение темы исследования «мыслительных процессов» LLM. Anthropic на днях открыла для широкого профессионального и научного сообщества инструментарий, позволяющий повторить ранее представленную методологию компании для отслеживания процесса принятия решений в больших языковых моделях. Подход заключается в создании графов атрибуции, частично раскрывающих шаги, которые модель предприняла внутри, чтобы прийти к решению о конкретном выводе. Компания выложила библиотеку инструментов с открытым исходным кодом для создания графов атрибуции на популярных моделях с открытыми весами, а также разместила на Neuronpedia интерфейс, позволяющий исследовать графы в интерактивном режиме. Подробности и все ссылки тут.

Исследователи определили границы сжатия информации для языковых моделей

Ученые из AIRI, МФТИ и Лондонского математического института изучили пределы сжатия для современных LLM, то есть какой объем информации они способны эффективно хранить и обрабатывать внутри себя, сообщает CNews. В своем исследовании они подтвердили, что текст в 1,5 тыс. токенов можно сжать в один вектор. И таким образом книга типа «Хоббит, или Туда и обратно» объемом около 120 тыс. токенов может быть представлена всего в 100–200 векторах, в зависимости от размера модели. Максимально достижимый коэффициент сжатия без потерь обычно не превышает x10, но эта работа показывает, что существуют векторы с коэффициентами сжатия до x1500. На научном исследование описано тут.

Российские ученые представили новую аction-модель Vintix

Еще одна новость от российских разработчиков. Институт AIRI выложил в открытый доступ  action-модель Vintix, пишет Forbes. Это тип ИИ-моделей, которые принимают решения о действиях в ответ на информацию из окружающей среды и могут быть использованы в робототехнике и управлении процессами в промышленности. В статье сообщается, что Vintix  анализирует в три раза больше информации по сравнению с аналогами, такими как JAT от HugginFace и GATO от Google DeepMind. Модель способна к самокоррекции и самоулучшению, ее архитектура устойчива к шуму и частичной наблюдаемости среды, что делает ее пригодной для промышленного применения.

Meta* открывает новую ИИ-лабораторию

Компания Meta (признана в России экстремистской организацией и запрещена) собирается в ближайшее время запустить новую исследовательскую лабораторию с целью создания суперинтеллекта – ИИ-системы, превосходящей возможности человека.Об этом пишет The New York Times, сообщая также, что к лаборатории присоединится основатель ИИ-стартапа Scale AI Александр Ван. Создание лаборатории – часть усилий Meta* по реорганизации ИИ-ветви бизнеса, которая в последнее время сталкивается с множеством внутренних и внешних вызовов.

*Компания Meta Platforms признана в России экстремистской организацией и запрещена.

Новости
Главное за последнее время
Смотреть все
ВобъективеИИ
Влияние опечаток на LLM и исследование генома
Технологии
MWS AI выпускает открытого ИИ-ассистента для программистов
ВобъективеИИ
Новая action-модель и отслеживание мыслей LLM
Решения
MTS AI выпустила корпоративных ИИ-помощников для поиска по документам и аналитики
Исследования
Более 60% россиян уже не могут отличить дипфейк от фотографии
ВобъективеИИ
Bring Your Own AI и новый метод обучения LLM от Alibaba
ВобъективеИИ
Язык дельфинов и самодетоксикация LLM
ВобъективеИИ
ИИ-хакеры и новые конкуренты DeepSeek
Исследования
Исследование MTS AI: У 70% программистов есть претензии к ИИ-ассистентам для написания кода, но большинство признает их пользу
Технологии
MTS AI выводит на рынок нового ИИ-ассистента для разработчиков