MTS AI стала хедлайнером технологического трека Conversations

MTS AI присоединилась к одной из крупнейших конференций по разговорному ИИ в России. Компания стала партнером Conversations и хедлайнером технологического трека.

На конференции выступили руководитель группы поиска MTS AI Никита Крайко и руководитель группы Kodify Валентин Малых. Никита Крайко в своем докладе рассказал о подходах и инструментах для улучшения качества генеративных ответов языковых моделей (LLM) с использованием методов автоматической валидации и оценки, таких как RuRAGE (Robust Universal RAG Evaluator).

Валентин Малых присоединился к панельной дискуссии «Генеративный AI в разработке: yay or nay?», где вместе с другими экспертами обсудил помогают ли LLM сделать процесс создания программного обеспечения более эффективным: автоматизировать рутину и предсказывать потенциальные проблемы.

На выставке в рамках Conversations MTS AI представила стенд, на котором можно было узнать о продуктах и решениях компании, в том числе языковых моделях семейства Cotype, сделать пиксельное фото в фотобудке, поиграть в дартс и поучаствовать в викторине.

Основная суть доклада презентации заключается в обсуждении подходов и инструментов для улучшения качества генеративных ответов языковых моделей (LLM) с использованием методов автоматической валидации и оценки, таких как RuRAGE (Robust Universal RAG Evaluator). Также представлено применение моделей RAG (Retrieval-Augmented Generation) в задачах NLP и анализируются типы ошибок, метрики и методики их устранения.

Главные мысли доклада:

  1. Применение RAG:
    • RAG позволяет обогащать диалоги информацией из внешних баз знаний, что улучшает релевантность и точность ответов.
    • Основные задачи включают генерацию контекстуально обоснованных ответов и минимизацию ошибок.
  2. Типы ошибок LLM:
    • Лингвистические ошибки (грамматика, лексика).
    • Этические ошибки (некорректные или предвзятые высказывания).
    • Фактологические ошибки (неверная или устаревшая информация).
    • Методы устранения включают улучшение данных обучения, применение фильтров и механизмов проверки фактов.
  3. Метрики оценки:
    • Relevance (релевантность ответа вопросу).
    • Faithfulness (соответствие ответа контексту).
    • Usefulness (соответствие эталонному ответу).
    • Используются как детерминированные метрики, так и человеческая оценка.
  4. RuRAGE:
    • Инструмент для валидации RAG-систем, объединяющий слабые метрики в ансамбль.
    • Подготовка Golden-set эталонных ответов повышает точность оценки.
    • Улучшает корреляцию результатов с человеческой оценкой.
  5. Feature Selection:
    • Отбор признаков для оптимизации оценки, использование Uncertainty метрик.
    • Лучшие результаты показывают метрики, связанные с точностью и последовательностью генерации.
  6. Результаты:
    • RuRAGE и GPT-4o как инструменты оценки демонстрируют высокую корреляцию с человеческими оценками.
    • Инструмент поддерживает работу с бинарной и мультиклассовой разметкой.
  7. Презентация модели Cotype Nano:
    • Легковесная LLM с 1,5 млрд параметров, оптимизированная для минимального потребления ресурсов.

Если требуется более детальная информация по определённым разделам, уточните, пожалуйста!

Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Новости
Главное за последнее время
Смотреть все
События
Вебинар «Как бизнесу использовать LLM в 2025 году»
События
Вебинар «Биометрические сервисы в реалиях 572-ФЗ»
События
Вебинар: как с помощью ИИ защитить бизнес и репутацию от дипфейков
События
Вебинар: разговор на языке данных
ВобъективеИИ
Предсказания Маска и конкуренция на ИИ-поле
Новости команды
MTS AI подписала декларацию об ответственной разработке генеративного ИИ
ВобъективеИИ
Хайп вокруг китайских моделей и умный трактор
ВобъективеИИ
ИИ для генетиков и минисуперкомпьютер от NVIDIA
Технологии
Спуфинг и дипфейки: бизнес под прицелом. Исследование MTS AI и Б1
ВобъективеИИ
Многослойные чипы и польза галлюцинаций
Технологии
MTS AI запускает открытую большую языковую модель
ВобъективеИИ
ИИ-интриги и промышленные коботы
ВобъективеИИ
Снижение цен на лидары и расцвет промышленной роботизации в Китае
ВобъективеИИ
«Кентавр» для имитации поведения человека и ИИ-вдохновение от Кандинского
ВобъективеИИ
Машина Хабермаса и дружба ИИ с аддитивными технологиями