Авито научил ИИ создавать объявления по фотографии
A-Vision определяет характеристики вещи и формирует название и описание товара
A-Vision определяет характеристики вещи и формирует название и описание товара
Технологическая платформа Авито запускает «Разберём гардероб» — первый, по словам компании, на российском рынке классифайдов сценарий, в котором ИИ создаёт объявление о продаже одежды по фотографии. Собственная мультимодальная модель A-Vision определяет характеристики вещи и формирует название и описание товара. Во время тестирования пользователи опубликовали через новый сценарий более 100 тысяч объявлений — примерно в половине случаев не изменив ни одного параметра.
Ранее искусственный интеллект на Авито помогал составить только текстовое описание на основе информации, которую пользователь самостоятельно указывал при создании объявления — это было реализовано в функционале автоописания. Теперь A-Vision анализирует изображение и формирует весь блок данных о товаре — от категории и характеристик до названия и текста.
В стандартном сценарии пользователь должен последовательно заполнить данные о товаре на нескольких экранах. В «Разберём гардероб» они выводятся на одном экране в виде готовой карточки, которую можно проверить и скорректировать перед публикацией. Во время тестирования новый сценарий примерно на 40% сократил количество отдельных экранов при создании объявления со смартфона.
Функция также помогает определить стоимость вещи. Внутренняя ML система оценки стоимости товаров анализирует актуальные цены на аналогичные предложения на платформе и предлагает рекомендованную цену.
«Раньше ИИ подключался на отдельном этапе и составлял описание по уже заполненным данным. Теперь модель работает непосредственно с изображением и сама формирует основные параметры объявления. Наша задача — сделать так, чтобы для начала продажи пользователю было достаточно фотографии. Мы ожидаем, что к 2030 году таким способом будет публиковаться больше половины объявлений по продаже одежды и обуви».
Для запуска функции команда Авито дообучила A-Vision с помощью LoRA-адаптеров — метода, который позволяет настроить большую модель под конкретную задачу без её полного переобучения. Модель адаптировали к фотографиям частных продавцов: вещи могут быть сняты при бытовом освещении, на разном фоне, на полу, диване или вешалке.
Такие изображения отличаются от подготовленных каталожных фотографий по ракурсу, освещению и композиции. A-Vision анализирует обычный снимок со смартфона и определяет параметры, необходимые для создания объявления, включая тип вещи, бренд, цвет, материал, размер и состояние.
«Разберём гардероб» ориентирован на частных продавцов и доступен в мобильном приложении Авито в разделе «Мои объявления» во вкладке «Можно продать». В данный момент функция доступна для продажи товаров из категории взрослой и детской одежды; в будущем Авито планирует расширять этот список.