08.08.2025

Новые открытые модели OpenAI и опенсорсный Grok 2

В этом дайджесте #ВобъективеИИ мы (так получилось) собрали громкие новости почти от всех техгигантов ИИ-индустрии. Вы узнаете об опенсорсных премьерах от OpenAI, очередной версии модели Genie от Google DeepMind, генераторе изображений от Alibaba, планах Маска выложить в открытый доступ веса Grok 2 и новой версии Claude Opus с очередным прорывом в области кодинга. Даже достаточно редкий гость нашего дайджеста — Apple — здесь.

AI-focused digest – новости ИИ-сферы

Выпуск № 70, 25 июля – 7 августа 2025

OpenAI выложила в опенсорс две рассуждающие LLM

OpenAI выложила на Hugging Face две рассуждающие LLM, которые, как утверждается, соответствуют по возможностям языковым моделям o-серии. Они доступны для скачивания в двух вариантах: более крупная и производительная gpt-oss-120b, которая может работать на одной видеокарте Nvidia, и более лёгкая модель gpt-oss-20b — ее можно запустить на обычном ноутбуке с 16 ГБ памяти. Это первый выпуск открытых моделей у OpenAI со времен GPT-2. Подробности у TechCrunch.

Google DeepMind представила очередную Genie — с улучшенным пониманием законов природы

Исследователи из Google DeepMind представили Genie 3 — очередную версию моделей семейства Genie для генерации итеративных виртуальных миров. По текстовому запросу ИИ-модель может создавать динамические среды, по которым возможно перемещаться в режиме реального времени с частотой 24 кадра в секунду. Согласованность картинки сохраняется в течение нескольких минут — предыдущие версии могли похвастаться лишь 20 секундами. Разрешение — 720p. Еще из важного — обеспечено глубокое понимание физических законов природы. Больше о возможностях, а также ограничениях модели (а заодно ее возможной роли для развития ИИ-агентов и AGI) можно почитать на сайте Google.

Новая версия Claude Opus превзошла конкурентов в задачах разработки

Anthropic выпустила обновлённую версию своей флагманской модели искусственного интеллекта — Claude Opus 4.1 — с выдающимися показателями производительности в задачах разработки ПО. Новый «Клод» набрал 74,5% в SWE-bench Verified — известном бенчмарке для проверки способностей ИИ в кодинге. Это выше, чем у o3 от OpenAI (69,1%) и Gemini 2.5 Pro от Google (67,2%). Так Anthropic подтверждает свое лидерство в сфере ИИ для программистов. К слову, мы тут досадно упустили в прошлых дайджестах тот факт, что на рынке инструментов для кодинга может появиться еще один игрок — Apple. Рекомендуем почитать вот эту статью про DiffuCoder — опенсорсную модель для программирования от «яблочной» компании, работающую на непривычных для этих задач алгоритмах диффузии.

Разработчики Alibaba выпустили генератор изображений Qwen-Image

Дошла очередь до Qwen. Команда разработчиков Alibaba выпустила Qwen-Image — опенсорсную модель для генерации изображений. Ее фишка — точное отображение текста на визуалах. Модель эффективна в работе со сложной типографикой и многострочной версткой, а еще может генерировать изображения текста со смешением разных языков. Это пригодится для создания афиш, слайдов презентаций, витрин, инфографики и прочих материалов, где имеет место сочетание контента разной модальности. Неплохой обзор Qwen-Image дан у VentureBeat.

Grok 2 станет опенсорсным

Ну и напоследок новость, которую мы не могли проигнорировать. Илон Маск пообещал, что выложит в открытый доступ веса Grok 2 на следующей неделе. Агентство Reuters написало об этом однострочную новость — вот и мы не будем многословны и подождем, сбудется ли…

До встречи на следующей неделе!