07.03.2024

Новые «Клоды», поющие портреты и аватар нейрохирурга

Иск Илона Маска к OpenAI, водопад инвестиций в разработчика человекоподобных роботов, новое семейство моделей от Anthropic, ИИ-система, создающая поющие портреты, и аватар нейрохирурга — обо всем этом мы расскажем в нашем новом выпуске дайджеста #ВобъективеИИ.

AI-focused digest – новости ИИ-сферы

Выпуск №37, 22 февраля — 7 марта 2024

Илон Маск хочет заставить OpenAI служить человечеству через суд

Начало весны отметилось еще одним иском против OpenAI. На этот раз претензии создателю ChatGPT выдвинул Илон Маск. Он обвинил компанию и ее генерального директора Сэма Альтмана в отклонении от первоначальной миссии — создать AGI на благо всего человечества — в сторону финансовой выгоды для отдельных людей и компаний, в частности — Microsoft. Об этом пишут все мировые СМИ. Сообщается, что цель иска — заставить OpenAI вернуться к исходной миссии и открыть свои технологии для широкой общественности. OpenAI с обвинениями миллиардера, что ожидаемо, не соглашается. С официальным ответом компании можно познакомиться в ее блоге.

Технологические лидеры инвестируют в человекоподобных роботов

Если вы интересуетесь развитием ИИ и робототехники, то вам нужно запомнить новое название — Figure AI. Этот стартап, разрабатывающий человекоподобных роботов, привлек внимание целого ряда крупных инвесторов и технологических компаний. Как пишет Bloomberg, в проект вложились OpenAI, Microsoft, Nvidia, Amazon, сам Джефф Безос (через Explore Investments LLC), а еще Intel Corp., Samsung, LG Innotek, Parkway Venture Capital, Align Ventures, ARK Venture Fund, Aliya Capital Partners, Tamarack, Boscolo Intervest Ltd. и BOLD Capital Partners. Надеемся, что никого не забыли. Сообщается, что сейчас инженеры Figure AI трудятся над роботом под названием Figure 01. Стартап считает, что их разработки однажды смогут взять на себя выполнение опасных операций и решить проблему с нехваткой рабочей силы.

Anthropic вывела в свет новое семейство «Клодов»

Anthropic на днях представила миру новое семейство моделей — Claude 3. Названия у моделей музыкально-поэтические: Haiku, Sonnet и Opus. Самая «умная» из них — Opus. Как утверждает разработчик, она обходит GPT-4 и Gemini по всем фронтам, включая решение математических задач, кодирование, рассуждение и ответы на вопросы. Haiku — самая быстрая и экономичная модель в своей интеллектуальной категории: она может прочитать исследовательскую статью с большим объемом информации, диаграммами и графиками менее чем за три секунды. Sonnet отличается более высоким уровнем интеллекта и отлично справляется с такими задачами, как поиск информации или автоматизация продаж, при этом в большинстве случаев работая в два раза быстрее Claude 2 and Claude 2.1. Больше о способностях семейства Claude 3 можно узнать на сайте Anthropic.

Исследователи из Alibaba разработали ИИ-систему, оживляющую портреты

Институт интеллектуальных вычислений компании Alibaba Group разработал ИИ-систему с Audio2Video диффузионной моделью под капотом под названием EMO (сокращенно от Emote Portrait Alive). Она способна на основе портретного фото сгенерировать удивительно реалистичное видео, в котором человек говорит или поет, а движение лицевых мышц и головы максимально соответствует звуковой дорожке. VentureBeat пишет, что разработку Alibaba можно считать значительным прогрессом в «создании видео с говорящей головой». Научную статью с подробностями можно почитать здесь.

В MIT создали аватар знаменитого нейрохирурга для удаленной тренировки врачей

Массачусетский технологический институт и стартап EDUCSIM, занимающийся разработкой медицинских симуляторов с использованием AR/VR, объединили силы, чтобы создать виртуальный аватар известного детского нейрохирурга Бенджамина Уорфа (Benjamin Warf). С его помощью доктор Уорф, находясь в Бостоне, может показывать начинающим хирургам где-нибудь в Сан-Паулу или даже дальше, как проводить операции на головном мозге. При этом врачи с помощью очков виртуальной реальности видят цифрового двойника доктора почти как живого, могут задавать ему вопросы и получать ответы. Аватар способен работать в двух режимах: синхронном и асинхронном. В первом случае настоящий доктор Уорф управляет своим аватаром дистанционно в реальном времени. Аватар может гулять по комнате, говорить с хирургами, направлять их действия и показывать, как проводить те или иные процедуры на модели головного мозга. Такая вот «голопортация». Во втором — врачи имеют дело с заранее подготовленной демонстрацией аватара. Но и в этом случае у них есть возможность пообщаться с доктором-наставником, а точнее — с нейросетью, обученной на исследованиях и обширном наборе вопросов и ответов, предоставленных Уорфом. Об истории, целях и особенностях проекта рассказывает MIT News.