Новый выпуск дайджеста #ВОбъективеИИ уже спешит к вам. В этом выпуске поговорим о планах OpenAI по выпуску GPT-4.5 и GPT-5, узнаем больше про метод агентной детекции объектов от Эндрю Нг, изучим эксперименты по чтению мыслей и обновление Le Chat от Mistral AI.
AI-focused digest – новости ИИ-сферы
Выпуск № 59, 17 января — 13 февраля 2025
Глава OpenAI раскрыл планы по выпуску GPT-5
OpenAI готовит изменения в своей линейке моделей. Генеральный директор компании Сэм Альтман объявил о планах по выпуску GPT-4.5 и GPT-5. По словам Альтмана, первой выйдет модель GPT-4.5, получившая внутреннее название Orion. Она станет «последней нерассуждающей моделью OpenAI». Примечательно, что модель обучили в октябре прошлого года, но её запуск отложили — компания столкнулась с высокими затратами на обучение и нехваткой данных. Следующим шагом станет выпуск GPT-5, которая объединит в себе множество технологий OpenAI, включая их самую продвинутую на данный момент модель o3. Компания планирует отказаться от отдельной поставки o3, интегрировав её возможности в новую систему. Пользователи бесплатной версии ChatGPT получат неограниченный доступ к GPT-5 модели на стандартных настройках интеллекта. Подписчики тарифа Plus смогут использовать GPT-5 с повышенным уровнем интеллекта, а пользователи Pro получат доступ к максимальным возможностям системы. Точные сроки выпуска новых моделей Альтман не назвал, но указал, что их релиз состоится в ближайшие недели или месяцы.
В США создали систему поиска объектов без предварительной разметки данных
Американский ученый Эндрю Нг (Andrew Ng) представил революционный метод агентной детекции объектов (Agentic Object Detection). В отличие от привычных способов он не требует предварительной разметки данных и позволяет находить предметы по текстовому описанию. Например, пользователь может попросить систему найти «неспелые клубники» на изображении, и она справится с этой задачей без предварительного обучения на размеченных данных. Технология использует продвинутые алгоритмы рассуждений для анализа различных характеристик объектов: цвета, формы и пространственных отношений. Эксперты прогнозируют широкое применение агентной детекции в различных отраслях, от игровой индустрии до промышленной автоматизации. Разработчики продолжают совершенствовать систему и планируют добавить функции отслеживания объектов и поддержку видеоконтента. За подробностями — сюда.
Meta* разработала технологию чтения мыслей для набора текста
Исследователи из Meta предложили неинвазивный метод «чтения» мыслей, позволяющий декодировать текст, который человек планирует набрать по его мозговой активности. Участникам эксперимента предлагалось запомнить предложения и потом набрать их на стандартной клавиатуре. Их мозговые сигналы регистрировались с помощью электромагнитной энцефалографии (MEG) и электроэнцефалографии (EEG). Уникальность методики заключается в использовании инновационной архитектуры Brain2Qwerty. Она состоит из нескольких компонентов. Сверточный модуль анализирует короткие временные окна мозговых сигналов, выделяя ключевые особенности моторной активности при нажатии клавиш. Трансформер учитывает контекст всей фразы. Предварительно обученная модель «исправляет» возможные ошибки, учитывая статистику естественного языка. В ходе эксперимента 35 здоровых добровольцев набирали предложения, а система смогла расшифровать их мысли с относительно низким уровнем ошибок. При использовании MEG достигались в среднем 32% ошибок на символ, а у отдельных участников — всего 19%. Читаем подробности исследования на сайте Meta.
*Компания Meta признана в России экстремистской и запрещена
Mistral AI представляет обновленный Le Chat
Компания Mistral AI объявила о масштабном обновлении своего ИИ-ассистента Le Chat. Ключевой особенностью его новой версии стала функция Flash Answers, обеспечивающая обработку до 1000 слов в секунду. Le Chat получил улучшенную систему распознавания документов и изображений, которая, по заявлению разработчиков, является лучшей в индустрии. Ассистент способен анализировать сложные PDF-файлы, таблицы, логи и даже трудночитаемые изображения. В обновлении появился встроенный интерпретатор кода, позволяющий запускать программы в изолированной среде, проводить научный анализ и генерировать изображения. Система получает информацию из различных источников, включая веб-поиск, журналистские материалы и социальные сети, что, по словам разработчиков, обеспечивает всесторонние и обоснованные ответы. В ближайшем будущем создатели ассистента планируют добавить возможность подключения к корпоративным системам и создания ИИ-агентов.
Российские ученые расшифровали рукописи Пушкина с помощью ИИ
Специалисты компании Smart Engines применили искусственный интеллект
для расшифровки зачеркнутых фрагментов в рукописях Александра Пушкина. Нейросетевая архитектура «Да Винчи», изначально разработанная для распознавания документов, смогла воссоздать зачеркнутые слова, анализируя характерные особенности почерка поэта. Система изучает движения пера в сохранившихся текстах и на основе этих данных восстанавливает утраченные фрагменты. По словам генерального директора Smart Engines Владимира Арлазарова, эта технология открывает новые возможности не только для изучения рукописей Пушкина, но и других исторических документов. Метод уже позволил обнаружить несколько ранее неизвестных слов в черновиках поэта. Больше подробностей здесь.