Онлайн-сервис для подбора гостиниц обратился в MTS AI с задачей автоматизировать проверку описаний жилых объектов. Иногда представители отелей или владельцы апартаментов не заполняют карточки полностью или указывают в описание то, чего на самом деле нет. Это приводит к тому, что часть отелей не индексируется в поиске, падает конверсия и глубина просмотра, и соответственно, потенциальные постояльцы проходят мимо. Помимо этого, подобные ошибки вводят клиентов в заблуждение, и они ставят низкие оценки отелям и самому сервису.
По этой причине все описания жилых объектов нуждаются в модерации. Сотрудники сервиса сравнивают описания номеров с фотографиями. Это кропотливая работа, которая требует привлечения большого количества ресурсов.
Цели проекта, которые поставил заказчик MTS AI, состояли в том, чтобы увеличить скорость работы, уменьшить ручной труд модераторов, а также повысить глубину просмотра объявлений за счет расширения информации о каждом объекте размещения. Рассказываем подробно об использовании нейросетей для подобных проектов и том, какое решение реализовала команда MTS AI.
Зачем агрегаторам нужны нейросети
Искусственный интеллект уже давно активно помогает как самим онлайн-агрегаторам объявлений по продаже товаров, жилья и т.д., так и тем, кто публикует в них свои предложения. Нейросети значительно экономят время время: одним — на написании текстов для продажи, другим — на подборку фото, модерацию контента.
С помощью больших языковых моделей можно составить подробное описание товара для любого маркетплейса на уровне профессионального копирайтера. Для этого нужно сформулировать корректный запрос к нейросети, или загрузить в нее фотографию товара и попросить подготовить описание. Часто такие тексты получаются даже более подробными и «продающими», чем написанные самими продавцами.
Помимо основных характеристик товара, большая языковая модель может автоматически определить его категорию (одежда, бытовая техника и т.д.), а также добавить советы и рекомендации по его использованию. Это позволяет значительно повысить эффективность продаж и ускорить размещение объявлений без потери качества описаний.
Сами агрегаторы онлайн-объявлений также тратят значительные ресурсы на модерацию объявлений на своих площадках, и частично снизить эти затраты помогает искусственный интеллект.
Помимо этого, нейросети помогают выявить случаи нарушения правил площадки — например, если пользователь размещает на сайте что-то противозаконное или пытается заново с нового аккаунта опубликовать объявление, которое ранее уже было заблокировано командой модераторов.
Какое решение предложили разработчики MTS AI
Вместо того, чтобы разрабатывать нейросеть с нуля, команда MTS AI использовала опенсорсный алгоритм распознавания объектов DETR (detection transformer). Эта языковая модель может анализировать содержание фотографий, отвечая на запросы пользователя, есть ли тот или иной предмет на изображении. Она уже обучена на различных датасетах и может найти на фотографии картину, шкаф, кровать, фен и другие предметы. Одним из ее разработчиков был Сергей Загоруйко, который сейчас также работает в MTS AI руководителем направления фундаментальных исследований.
В рамках пилотного проекта MTS AI использовала DETR и набор алгоритмов, построенных на его основе, а также созданных по похожему принципу. Они были нужны, чтобы сопоставить фотографии гостиничных номеров и апартаментов с их описаниями, которые предоставили отельеры. Сначала сотрудники сервиса спрашивали у модели, есть ли на фото заявленные предметы. После этого пользователь задавал контрольный вопрос, что нейросеть вообще видит на фотографии — и дополнял список теми предметами, которые смогла распознать нейросеть.
Таким образом языковая модель автоматически сопоставляла список предметов в гостиничном номере с тем, что действительно находится в нем, а также самостоятельно дополняла этот перечень тем, что забыл указать автор объявления.
Для доработки языковой модели в рамках пилотного проекта разработали еще одну классическую нейросеть с разметкой данных, чтобы снизить вероятность ложного распознавания объектов на изображениях. Для этого использовали сравнительно небольшой датасет из 300 фотографий от заказчика, однако этого хватило, чтобы почти полностью устранить риск ложных результатов.
Результат
В рамках пилотного тестирования MTS AI удалось повысить точность распознавания объектов на фотографиях порядка 95%. Таким образом нейросеть фактически снимает значительную часть рутинной работы с отдела модерации, позволяет сэкономить ресурсы и использовать время сотрудников для решения других задач: звонкам владельцам объекта, составлению креативных описаний.
В ходе тестирования выяснилось, что нейросети могут предоставить значительно больше информации об объекте размещения, чем обычно предоставляют сами владельцы бизнеса. За счет большого количества параметров, которые автоматически заполняются ML-моделями повышается глубина просмотра таких объявлений и релевантность поисковой выдачи номеров. В рамках пилота нейросеть может распознавать 6 предметов, в будущем сервис сможет анализировать объекты размещения по 29 различным параметрам.
Использование уже готовой модели DETR значительно сократило возможные расходы, поскольку такой подход оказался значительно проще и быстрее, чем обучение нейросети для распознавания объектов на фотографии с нуля.