13.03.2025

Битва ИИ-агентов и новый метод анализа данных для медиков

Встречайте первый весенний дайджест #ВобъективеИИ. Поговорим о заочном соревновании разработчиков ИИ-агентов, пользе казуального машинного обучения, новом методе анализа медицинских изображений из США и нейросети для психологического тестирования из России.

AI-focused digest – новости ИИ-сферы

Выпуск № 61, 28 февраля — 13 марта 2025

Китайский стартап выпустил ИИ-агента для решения сложных задач

По словам разработчиков, Manus умеет самостоятельно решать сложные задачи — от планирования путешествий до финансового анализа. В названии агента заложили глубокий смысл: оно происходит от латинских Mens et Manus слов (лат. «разум и рука»). Таким образом создатели Manus решили подчеркнуть его улучшенные способности к планированию, по сравнению с Operator от OpenAI и Claude Computer Use от Anthropic. Система работает с помощью текстовых подсказок — пользователи описывают, что они хотят сделать, а Manus преобразует инструкции на естественном языке в реальные шаги. Разработчики утверждают, что Manus лучше, чем DeepResearch от OpenAI, по тестам на бенчмарке GAIA, который оценивает AI-агентов по выполнению практических задач. Впрочем, получить доступ к агенту не так-то просто, а технические детали разработчики не разглашают. Те, кто успел попробовать Manus, пишут, что он упускает очевидную информацию и не справился с задачами по бронированию билетов и заказу еды.

OpenAI представила новый набор инструментов для разработки ИИ-агентов

Американская компания тоже решила не отставать в гонке технологий. OpenAI выпустила целый комплекс инструментов для разработки ИИ-агентов — Responses API, который заменит Assistants API. Новая платформа позволит создавать помощников, которые могут самостоятельно искать информацию в интернете, извлекать файлы и анализировать корпоративные файлы через поисковый инструмент, а также, например, автоматизировать ввод данных. В основе решения Computer-Using Agent (CUA) — модель, которая также использовалась для создания агента Operator, появившегося ранее. Сами разработчики признают ее несовершенной и планируют доработать в дальнейшем. Также OpenAI выпустила Agents SDK — это opensource-набор инструментов, который позволяет интегрировать модели с внутренними системами, внедрять защитные механизмы и мониторить активность агентов.

Европейские ученые предложили бизнесу активнее использовать Casual ML

MIT Sloan Management выпустил статью о казуальном, или причинно-следственном, машинном обучении. Авторы публикации — исследователи из Лозаннского и Мюнхенского университета Людвига-Максимилиана (LMU), а также из Высшей технической школы Цюриха (ETH Zurich). В отличие от традиционного ML, который делает прогнозы на основе корреляции фактов, казуальное машинное обучение отвечает на вопросы «что будет, если мы сделаем то-то?» — подобно тому, как маркетологи проводят A/B-тесты, чтобы понять, какая реклама даст больше продаж. По мнению авторов, Casual ML имеет большой потенциал для бизнеса, поскольку с помощью этого метода компании смогут улучшить процесс принятия решений и найти ответы на практические вопросы вроде «Что если мы увеличим рекламу, какой эффект даст новая программа обучения сотрудников». Подробнее о Casual ML можно почитать не только на MIT Sloan Management, но и в статье разработчиков метода.

В США ученые придумали способ быстрее и точнее анализировать медицинские изображения

Группа исследователей из ведущих американских университетов США представила новый метод машинного обучения для анализа временных изменений в медицинских изображениях (Learning-based Inference of Longitudinal Image Changes или LILAC)». Он позволяет автоматически анализировать изменения в результатах обследований, полученных в разные моменты времени. Новый метод разработала команда исследователей из Корнеллского и Стэнфордского университетов. LILAC использует сверточную архитектуру для сравнения пар изображений, что позволяет выделять значимые изменения, игнорируя нерелевантные вариации, такие как шум или различия в поле зрения. Метод обучается на двух основных задачах: предсказание того, какое изображение было сделано раньше, и прогнозирование конкретных изменений в медицинских показателях. По словам ученых, LILAC отличается от других способов своей универсальностью — он не требует сложной предварительной обработки изображений и может быть применен к различным типам данных, от микроскопических снимков до МРТ. Ученые надеются, что LILAC найдет широкое применение в клинической практике и поможет улучшить понимание сложных процессов, таких как развитие эмбрионов, заживление ран и старение мозга.

Российские ученые создали нейросеть для выявления тревожности у детей

Исследователи Московского государственного психолого-педагогического университета (МГППУ) разработали ML-модель, которая поможет психологам выявлять особенности личности ребенка по рисунку. Нейросеть в том числе обучена определять признаки повышенной тревожности или агрессии. Для этого специалисту нужно попросить ребенка нарисовать человека простым карандашом на листе бумаги, затем сфотографировать результат и загрузить его в приложение. Система проанализирует рисунок и даст характеристику личности испытуемого. Ожидается, что решение поможет начинающим педагогам и психологам получить второе мнение в спорных ситуациях и избежать ошибок в диагностике.