#ВобъективеИИ продолжает знакомить вас с самыми интересными новостями из мира искусственного интеллекта. В этом выпуске вы узнаете об экспериментах с ИИ в области имитации общественного мнения, новом подходе к обучению моделей распознаванию и генерации изображений, умных тележках для супермаркетов, роботе для тренировки теннисистов и «железном дирижере» для национального оркестра Южной Кореи.
AI-focused digest – новости ИИ-сферы
Выпуск №21, 22 июня — 6 июля 2023
ИИ может имитировать мнение людей в конкретных странах
Международная группа исследователей провела несколько экспериментов с ИИ, чтобы посмотреть, как его ответы по глобальным социальным, экономическим и этическим вопросам отличаются от ответов людей из разных стран. Они работали с LLM, предварительно обученной на данных преимущественно на английском языке и донастроенной быть «полезной, честной и безвредной» при помощи обучения с подкреплением на основе обратной связи от человека (RLHF). В рамках экспериментов ученые задавали модели те же вопросы, что и людям в разных странах. Без дополнительных настроек ответы LLM были похожи на ответы в США, странах Европы и Южной Америки, где преобладает так называемое WEIRD-население (Western, Educated, Industrialized, Rich, Democratic). Это может быть последствием того, что модель предварительно обучалась на преимущественно англоязычных материалах, и сигнализирует о предвзятости. Причем язык, на котором задавались вопросы, не слишком влиял на результаты — то есть, даже если вопросы для модели были на русском, ее ответы не были похожи на ответы людей из России. Однако если модель просили учитывать точку зрения конкретной страны, она запросто с этим справлялась — ее ответы плюс-минус совпадали с ответами населения этой страны. Но говорить о тонком понимании ИИ национальных особенностей пока не приходится — некоторые ответы содержали чрезмерное обобщение сложных культурных ценностей. Подробности — в препринте по этой ссылке.
Google и MIT научились обучать модели распознаванию и генерации изображений в одной структуре
Обычно модели для решения задач генерации и распознавания изображений обучаются независимо друг от друга, что приводит к дополнительным расходам на их разработку и поддержку, а также к недополученным синергетическим выгодам. Это явно не устраивало экспертов из Google и MIT, и они разработали Masked Generative Encoder (MAGE) — систему, которая позволяет проводить обучение моделей функциям распознавания и генерации в единой структуре. Волшебство заключается в применении так называемого «моделирования замаскированных токенов» (masked token modeling). То есть система сначала преобразует изображение в семантические токены (semantic tokens), а затем скрывает некоторые из этих токенов, будто создавая головоломку, и обучает нейронную сеть заполнять образовавшиеся пробелы. Так модель учится одновременно понимать закономерности в изображении (распознавание изображений) и генерировать новые (генерация изображений). В деталях метод расписан в этой статье и на сайте MIT News.
В Америке изобрели робота-теннисиста
Ученые из Технологического института Джорджии (США) создали робота-теннисиста с компьютерным зрением, который при должных тренировках может обыграть лидеров Уимблдона. Правда, цель изобретения — не заменить собой спортсменов, а помогать им совершенствовать мастерство. Робот, в отличие от стационарной системы подачи мячей, может передвигаться по корту с высокой скоростью и отбивать удары, что уже делает его неплохим партнером для тренировок. Но для изобретателей это только начало пути. В настоящее время команда «тренирует» ESTHER (так зовут робота) для игры против высококвалифицированных противников. «ESTHER открывает множество захватывающих исследовательских возможностей в области имитационного обучения, обучения с подкреплением, кинодинамического планирования, сотрудничества человека и робота и многого другого», — комментирует Мэтью Гомболей (Matthew Gombolay), профессор робототехники и один из участников проекта. Подробнее об изобретении пишет Study Finds.
Умные тележки с компьютерным зрением избавят от очередей в супермаркетах
Американская компания Instacart представила новейшую версию продуктовых тележек Caper Cart с ИИ для более комфортного шопинга в супермаркетах. Разработка избавляет покупателей от изнурительного стояния в очередях к кассиру и от самостоятельного сканирования товаров на станциях самообслуживания. Тележки Caper Cart оснащены технологией компьютерного зрения и весами — они сканируют товары по мере их добавления и автоматически считают стоимость. А на большом сенсорном экране размещена информация о цене, реализован сервис навигации по магазину и возможность ведения онлайн-листа покупок. Оплатить все можно с помощью штрих-кода. Умные тележки уже дебютировали в Нью-Джерси и в ближайшее время появятся в супермаркетах Нью-Йорка. Об этом сообщает портал Food On Demand.
В Южной Корее робот дирижировал национальным оркестром
И напоследок новости культуры. Выступление национального оркестра Южной Кореи в Сеуле 30 июня 2023 года запомнится тем, что им впервые руководил робот-андроид EveR 6, разработанный Корейским институтом промышленных технологий. Робот успешно дирижировал оркестром в трех из пяти произведений программы. С оценками экспертов касательно дирижерского таланта EveR 6 можно ознакомиться в небольшом видеорепортаже на South China Morning Post.