Bring Your Own AI и новый метод обучения LLM от Alibaba

fgfg Picture

В свежем выпуске #ВобъективеИИ расскажем о новом методе от Alibaba для обучения языковых моделей поиску, продвинутом ИИ-агенте для кодинга от Google, рисках BYOAI, языковом неравенстве LLM и еще одной разработке для упрощения сложных текстов.

AI-focused digest – новости ИИ-сферы

Выпуск № 65, 24 апреля – 15 мая 2025

Alibaba предлагает новый метод обучения LLM для поиска информации

Китайский техногигант Alibaba представил новый подход к обучению LLM для решения задач по поиску, исключающий необходимость обращения к реальным поисковым системам в интернете для этих целей. Свой подход исследователи назвали ZeroSearch. Вместо реальных веб-поисков типа Google, в ZeroSearch при обучении LLM используется вторая модель, которая имитирует процесса поиска, генерируя как релевантные, так и нерелевантные ответы на запросы. Новый подход значительно удешевляет стоимость «тренировки» моделей – почти на 90%, пишет South China Morning Post. 

В Google DeepMind раскрыли планы по развитию нового ИИ-агента для кодирования на базе Gemini

На днях команда Google DeepMind рассказала о своей новой ИИ-системе под названием AlphaEvolve, которая может изобретать, тестировать и совершенствовать компьютерные алгоритмы и автоматически запускать их в работу. «AlphaEvolve — это агент кодирования ИИ на базе Gemini, который способен совершать новые открытия в области вычислений и математики», – так представил новую разработку Матей Балог, исследователь из Google DeepMind, в интервью VentureBeat. Разработчики рассчитывают, что их новое творение поможет оптимизировать инфраструктуру, которую Google использует для обучения LLM. AlphaEvolve уже работает в ряде подразделений техногиганта. В настоящее время DeepMind готовит пользовательский интерфейс для ИИ-агента и планирует вскоре сделать его доступным сначала узкому кругу исследователей, а затем, возможно, и более широкой аудитории. 

BYOAI – новый источник рисков для бизнеса

BYOAI (Bring Your Own AI), то есть использование некорпоративных ИИ-инструментов сотрудниками, становится большой проблемой для комплаенс. В новом исследовании Мельбурнского университета в Австралии и KPMG 48% из более чем 48 тыс. респондентов из 47 стран признались, что применяли ИИ вразрез политике компании, например, загружали конфиденциальную информацию в общедоступные сервисы, такие как ChatGPT. Сотрудники не только «разбалтывают» корпоративные секреты бигтеху (Google, OpenAI и прочим), но и скрывают использование ИИ от работодателей. Около 42% респондентов сообщили, что часто избегают раскрывать, когда они прибегают к помощи ИИ, а 55% представляли сгенерированный контент как свою собственную оригинальную работу. Кажется, пора компаниям ввести новый тренинг для сотрудников – по ответственному использованию искусственного интеллекта. 

Stanford HAI выпустил белую книгу по проблемам «языкового неравенства» LLM

Ученые Стэнфордского университета в очередной раз подняли проблему развития LLM в части языкового многообразия, выпустив белую книгу Mind the (Language) Gap: Mapping the Challenges of LLM Development in Low-Resource Language Contexts. Сейчас большинство мультиязычных больших языковых моделей неэффективны для языков, отличных от английского, и не учитывают культурные контексты народов-носителей, сообщается в документе. Особенно это касается малопредставленных в интернете языков типа суахили или бирманского. Главную проблему ученые видят в том, что по этим языкам не хватает маркированных и немаркированных данных, а те, что есть, часто имеют низкое качество и недостаточно репрезентативны. В связи с этим они призывают исследователей ИИ, спонсоров, политиков и общественные организации к стратегическому инвестированию в разработку ИИ для языков с низкими ресурсами, более тесному взаимодействию с сообществами-носителями и облегчению для разработчиков доступа к их языковым данным для обучения ИИ. Документ можно почитать здесь

Исследователи Google представили новую систему для упрощения сложных текстов

Вслед за выпуском приложения Simplify, которое пересказывает сложные тексты доступным языком, команда Google опубликовала научную статью, объясняющую работу технологии, на которой оно базируется. В ней они дали описание новой системы с автоматической оценкой и циклом итеративного уточнения подсказок, которая и позволяет моделям Gemini, лежащим в основе приложения, находить наиболее эффективную подсказку для упрощения текста с высокой точностью. А еще представили результаты масштабного рандомизированного исследования, которое подтверждает, что упрощение текста через Simplify заметно улучшает понимание пользователями сути и снижает когнитивную нагрузку.

Новости
Главное за последнее время
Смотреть все
Технологии
MTS AI выводит на рынок нового ИИ-ассистента для разработчиков
События
Вебинар «Как бизнесу использовать LLM в 2025 году»
События
Вебинар: как с помощью ИИ защитить бизнес и репутацию от дипфейков
События
Вебинар: разговор на языке данных
Новости команды
MTS AI подписала декларацию об ответственной разработке генеративного ИИ
ВобъективеИИ
Bring Your Own AI и новый метод обучения LLM от Alibaba
ВобъективеИИ
Язык дельфинов и самодетоксикация LLM
ВобъективеИИ
ИИ-хакеры и новые конкуренты DeepSeek
Новости команды
Исследование MTS AI: У 70% программистов есть претензии к ИИ-ассистентам для написания кода, но большинство признает их пользу
MTS AI в медиа
Агенты выстраиваются в линейку
Технологии
MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса
MTS AI в медиа
Эксперт рассказал, когда ИИ сможет обрабатывать все медицинские снимки
ВобъективеИИ
Мем-творчество ИИ и риски AGI
Кейсы
Сервис МТС Live подключил нейросеть от MTS AI к генерации описаний для билетной витрины