В этом выпуске #ВобъективеИИ мы расскажем, что еще произошло в сфере искусственного интеллекта помимо нобелевских премий по физике и химии. Вы узнаете о новом исследовании надежности больших языковых моделей, строительстве мощного суперкомпьютера на Тайване, альтернативе лидарам для систем компьютерного зрения и достижениях в монокулярной оценке глубины. А еще — как ИИ мотивирует разработчиков повышать квалификацию.
AI-focused digest – новости ИИ-сферы
Выпуск №51, 26 сентября — 10 октября 2024
LLM могут стать менее надежными по мере масштабирования
Под конец сентября ученые из Политехнического университета Валенсии (Испания) и Кембриджского университета (Великобритания) опубликовали интереснейшее исследование о том, как меняется надежность больших языковых моделей по мере их развития — масштабирования и обучения. Свои эксперименты они проводили на семействе моделей GPT от OpenAI, LLAMA от Meta (признана экстремистской и запрещена в России) и BLOOM от BigScience. Коротко выводы можно сформулировать так:
- Масштабные и более обученные LLM могут успешно решать сложнейшие задачи, но при этом не справиться с легкими.
- Чем больше и развитее большая языковая модель, тем меньше она склонна избегать вопросы, на которые не знает ответы. То есть вместо того, чтобы сказать, например, «Я не знаю», она может дать правдоподобный, но в корне неправильный ответ.
- Ответы LLM могут меняться в зависимости от того, как пользователи формулируют свои вопросы. При этом у моделей разный уровень чувствительности к подсказкам на разных уровнях сложности задач. Так что определить, какой промпт приведет LLM к правильному ответу, не получится. Это практически игра на удачу.
За подробностями по методам и результатам исследования — в Nature.
NVIDIA и Foxconn построят на Тайване суперкомпьютер, мощнейший на острове
Компания Foxconn в рамках проекта Hon Hai Kaohsiung Super Computing Center намерена построить на Тайване мощнейший на острове суперкомпьютер на базе технологий NVIDIA. Как сообщает NVIDIA в своем блоге, в основу проекта ляжет передовая архитектура Nvidia Blackwell и платформа GB200 NVL72. Предполагаемая производительность суперкомпьютера — 90 экзафлопс, это значит, что он станет самым быстрым на острове и одним из мощнейших в мире. Суперкомпьютер будет использоваться для медицинских исследований, разработки больших языковых моделей и инноваций для умных городов.
Стартап из Норвегии создает альтернативу лидарам для автономных роботизированных систем
Молодой стартап из Норвегии под названием Sonair разрабатывает новую систему компьютерного зрения, работающую на основе ультразвука. Разработчики считают, что их новаторский подход, предполагающий использование роботизированными автономными системами звуковых волн для обнаружения людей и других объектов, будет требовать гораздо меньше энергетических и вычислительных ресурсов. Эта технология может стать более эффективной заменой для традиционных лидаров. Подробности о том, на какой стадии находится разработка и каковы перспективы ее применения, есть в материале TechCrunch.
В Apple разработали ИИ-модель, способную значительно улучшить восприятие глубины машинами
Исследователи из Apple разработали ИИ-модель под названием Depth Pro, которая способна генерировать детализированную 3D-карту глубины с высоким разрешением по одному 2D-изображению. Причем делает она это за 0,3 секунды, на обычном графическом процессоре и не полагаясь на метаданные с камеры. VentureBeat пишет, что это значительный шаг вперед в сфере монокулярный оценки глубины. Разработка может найти широкое применение в секторах, где важна пространственная осведомленность в реальном времени, в частности, в различных системах дополненной реальности и автономном транспорте. Какие технологические приемы лежат в ее основе, читайте в этом препринте. А код и веса лежат на GitHub.
Развитие генеративного ИИ заставит разработчиков повышать квалификацию
Ну и в заключение — новость о том, как ИИ мотивирует учиться. Эксперты Gartner считают, что к 2027 году генеративный искусственный интеллект так трансформирует роли в разработке и сопровождении ПО, что 80% разработчиков придется повышать квалификацию. В пресс-релизе компании утверждается, что полностью роль инженера-разработчика не исчезнет —продвинутые навыки, творческий подход и опыт всегда будут востребованы для создания сложных систем, хотя большая часть кода в скором времени и будет генерироваться ИИ. Однако прогресс потребует появления нового типа профессионалов — с особым сочетанием навыков в области программной инженерии, дата-сайенс и машинного обучения.