MTS AI стала хедлайнером технологического трека Conversations

MTS AI присоединилась к одной из крупнейших конференций по разговорному ИИ в России. Компания стала партнером Conversations и хедлайнером технологического трека.

На конференции выступили руководитель группы поиска MTS AI Никита Крайко и руководитель группы Kodify Валентин Малых. Никита Крайко в своем докладе рассказал о подходах и инструментах для улучшения качества генеративных ответов языковых моделей (LLM) с использованием методов автоматической валидации и оценки, таких как RuRAGE (Robust Universal RAG Evaluator).

Валентин Малых присоединился к панельной дискуссии «Генеративный AI в разработке: yay or nay?», где вместе с другими экспертами обсудил помогают ли LLM сделать процесс создания программного обеспечения более эффективным: автоматизировать рутину и предсказывать потенциальные проблемы.

На выставке в рамках Conversations MTS AI представила стенд, на котором можно было узнать о продуктах и решениях компании, в том числе языковых моделях семейства Cotype, сделать пиксельное фото в фотобудке, поиграть в дартс и поучаствовать в викторине.

Основная суть доклада презентации заключается в обсуждении подходов и инструментов для улучшения качества генеративных ответов языковых моделей (LLM) с использованием методов автоматической валидации и оценки, таких как RuRAGE (Robust Universal RAG Evaluator). Также представлено применение моделей RAG (Retrieval-Augmented Generation) в задачах NLP и анализируются типы ошибок, метрики и методики их устранения.

Главные мысли доклада:

  1. Применение RAG:
    • RAG позволяет обогащать диалоги информацией из внешних баз знаний, что улучшает релевантность и точность ответов.
    • Основные задачи включают генерацию контекстуально обоснованных ответов и минимизацию ошибок.
  2. Типы ошибок LLM:
    • Лингвистические ошибки (грамматика, лексика).
    • Этические ошибки (некорректные или предвзятые высказывания).
    • Фактологические ошибки (неверная или устаревшая информация).
    • Методы устранения включают улучшение данных обучения, применение фильтров и механизмов проверки фактов.
  3. Метрики оценки:
    • Relevance (релевантность ответа вопросу).
    • Faithfulness (соответствие ответа контексту).
    • Usefulness (соответствие эталонному ответу).
    • Используются как детерминированные метрики, так и человеческая оценка.
  4. RuRAGE:
    • Инструмент для валидации RAG-систем, объединяющий слабые метрики в ансамбль.
    • Подготовка Golden-set эталонных ответов повышает точность оценки.
    • Улучшает корреляцию результатов с человеческой оценкой.
  5. Feature Selection:
    • Отбор признаков для оптимизации оценки, использование Uncertainty метрик.
    • Лучшие результаты показывают метрики, связанные с точностью и последовательностью генерации.
  6. Результаты:
    • RuRAGE и GPT-4o как инструменты оценки демонстрируют высокую корреляцию с человеческими оценками.
    • Инструмент поддерживает работу с бинарной и мультиклассовой разметкой.
  7. Презентация модели Cotype Nano:
    • Легковесная LLM с 1,5 млрд параметров, оптимизированная для минимального потребления ресурсов.

Если требуется более детальная информация по определённым разделам, уточните, пожалуйста!

Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Picture
Новости
Главное за последнее время
Смотреть все
Технологии
MTS AI выводит на рынок нового ИИ-ассистента для разработчиков
События
Вебинар «Как бизнесу использовать LLM в 2025 году»
События
Вебинар: как с помощью ИИ защитить бизнес и репутацию от дипфейков
События
Вебинар: разговор на языке данных
ВобъективеИИ
Предсказания Маска и конкуренция на ИИ-поле
Новости команды
MTS AI подписала декларацию об ответственной разработке генеративного ИИ
ВобъективеИИ
ИИ-хакеры и новые конкуренты DeepSeek
Новости команды
Исследование MTS AI: У 70% программистов есть претензии к ИИ-ассистентам для написания кода, но большинство признает их пользу
MTS AI в медиа
Агенты выстраиваются в линейку
Технологии
MTS AI выпустила Cotype Pro 2 — второе поколение LLM для бизнеса
MTS AI в медиа
Эксперт рассказал, когда ИИ сможет обрабатывать все медицинские снимки
ВобъективеИИ
Мем-творчество ИИ и риски AGI
Кейсы
Сервис МТС Live подключил нейросеть от MTS AI к генерации описаний для билетной витрины
Решения
Детектор мошенничества в текстовых и голосовых сообщениях
MTS AI в медиа
Раскрыть агента. Обзор понимания агентного ИИ