Помимо разработки шаблонов предметов и предметов: рекомендации по коллекциям

Типичная рекомендательная система электронной коммерции направлена на помощь в обнаружении, когда пользователь не выразил свой явный интерес с помощью поискового запроса. Он использует шаблоны, полученные на основе анализа истории активности пользователя, чтобы предлагать товары, которые пользователь, скорее всего, купит, с учетом текущего контекста сеанса. Помимо руководства пользователем на протяжении всего его путешествия, система рекомендаций играет дополнительную роль, позволяя обнаруживать случайный контент, который помогает раскрыть широту постоянно меняющегося каталога элементов.

Чтобы помочь пользователю во время его покупки, мы хотели бы показать предметы, похожие на те, к которым он проявил интерес. Для таких категорий, как книги и фильмы, отдельные предметы имеют собственную идентичность, и типичная потребность пользователя выражается путем прямого запроса за их титулы. Щелкнув результат поиска, пользователь может узнать точное название, которое он имел в виду. При переходе на страницу сведений об элементе мы можем помочь в обнаружении, показывая элементы, похожие на те, которые просматривает пользователь.

С другой стороны, запросы в таких категориях, как стиль жизни и предметы интерьера, выражаются в терминах коллекций предметов, а не конкретных предметов. Скажем, пользователь искал кроссовки Reebok и попал на страницу с описанием товара. Виджет, демонстрирующий похожие товары (более подробную информацию о виджете похожих товаров можно прочитать здесь), позволяет ей переходить к другой обуви от Reebok или кроссовкам от аналогичных премиальных брендов (например, Nike, Adidas и т. Д.). Что, если вместо того, чтобы рекомендовать отдельные предметы, мы рекомендуем коллекцию предметов?

Определение коллекций элементов с помощью таксономии категорий

Таксономия относится к схеме классификации предметов. В случае Flipkart каталог организован в виде иерархической структуры, в которой более 5000 категорий организованы в виде дерева.

Обычно категория очень широкая и включает в себя множество предметов. Например, товары в категории «обувь» могут охватывать широкий спектр: от повседневной одежды до формальной; от самых продаваемых брендов до нишевых. В общем, каждая категория имеет несколько характерных атрибутов, известных как аспекты, которые помогают нам разделить набор базовых элементов. Мы определяем такие подмножества, полученные фасетированием категорий, как коллекции предметов.

Коллекции предметов на g ранговых уровнях

Коллекция предметов может быть выражена как набор аспектов, применяемых к категории. По мере того, как мы добавляем больше атрибутов к определению коллекции элементов, она становится более детализированной. Например, «Обувь для бега Reebok» более конкретна, чем «Обувь для бега Reebok» и «Обувь для бега». Чем более детализирована коллекция, тем более связными являются элементы, лежащие в основе. В случае категории моды большой объем поисковых запросов - это широкие запросы, охватывающие либо всю категорию (например, обувь), либо атрибут вместе с категорией (например, обувь reebok). Это указывает на то, что пользователь имел в виду коллекцию, а не конкретный элемент.

Следовательно, коллекции, определенные с использованием фасетов «категория + атрибут», служат подходящей сущностью для демонстрации рекомендованного контента.

Не все атрибуты одинаково важны при определении коллекции на детальном уровне. Если мы начнем с обуви Reebok, мы можем выбрать цветовую основу, ведущую к обуви Blue Reebok, или выбрать цветовую основу, ведущую к обуви Reebok Running. Мы полагаемся на данные выбора фильтра клиентов, чтобы определить относительную важность различных сводных данных для разных категорий. В случае холодильников мощность является важным фактором при принятии решения, и, следовательно, большинство поисковых запросов вращаются вокруг значений мощности. Напротив, размер экрана является одним из основных критериев при выборе телевизора, и поэтому полезно сузить его в зависимости от размера экрана. Кроме того, анализируя журналы поисковых запросов пользователей, мы наблюдаем, что запросы типа «42 'телевизоры» более распространены по сравнению с «телевизорами Onida», что еще раз подчеркивает тот факт, что размер экрана является основным решающим фактором по сравнению с брендом для телевизоров. Следовательно, использование фиксированного набора опорных точек для определения детализированных коллекций по категориям будет менее эффективным для удовлетворения потребностей пользователей.

В следующих разделах мы подробно расскажем, как мы эволюционировали от рекомендаций отдельных элементов к рекомендациям по коллекциям, что привело к более эффективному обнаружению пользователями.

Анализ шаблонов: вычисление сходства между коллекциями элементов

Мы используем данные о поведении клиентов, чтобы выявлять закономерности среди коллекций предметов. В общем, шаблоны на уровне коллекции богаче, чем на уровне отдельного элемента, поскольку активность в коллекции представляет собой совокупную сумму действий по всем составляющим ее элементам. Кроме того, выполнение этого на уровне коллекции снижает степень холодного старта, поскольку новые элементы могут быть сопоставлены с существующей коллекцией, а существующие шаблоны этой коллекции могут использоваться там, где отдельные шаблоны элемент-элемент довольно редки.

Чтобы вычислить сходство между коллекциями, мы берем предметы, купленные в каждом порядке, и сопоставляем их с коллекцией. Если две коллекции были куплены вместе в большом количестве заказов, они, вероятно, связаны. Мы называем это количество совпадений частотой пар, нормализуя его по количеству индивидуальных покупок в обеих коллекциях. Существуют различные метрики для вычисления сходства коллекции; в нашем случае мы используем косинусное расстояние. Для наборов C1 и C2 косинусное расстояние определяется как:

После анализа данных о покупках клиентов мы обнаружили интересные закономерности. Первоначально мы разделили данные по категориям, что дало нам шаблоны одновременных коллекций внутри категории. После того, как мы удалили разделение и запустили вычисление сродства по всему набору данных, начали проявляться некоторые неочевидные закономерности. Это привело к разнообразному набору рекомендаций, и некоторые категории хвостов стали появляться на первый план. Например, футболки и кошельки Роналду появляются при анализе связанных коллекций наклеек для ноутбуков на тему Роналду. Футболки и кошельки относятся к категории моды, тогда как декали относятся к категории электроники, и ограничение коллекций одной категорией могло бы исключить этот узор.

Выявление сходства атрибутов и кластеризация

Рассмотрим особый случай, когда мы ограничиваем коллекции элементов одним атрибутом.

Для категории сари при рассмотрении коллекций с различными типами тканей сходство коллекций между парой тканей может использоваться в качестве прокси для сходства типов ткани. На Flipkart в каталоге сари перечислены 88 различных типов тканей, в том числе нейлон, жоржет, шифон, хлопок и их варианты. Ниже приведен один пример, показывающий 5 типов тканей, похожих на синтетический жоржет для категории сари.

Кроме того, похожие структуры могут быть сгруппированы в небольшое количество кластеров, что упрощает принятие решений пользователями.

Использование связанных коллекций

Ниже приведены несколько примеров использования связанных коллекций:

Увеличение размера корзины : Поскольку сродство коллекций определяется на основе данных о совместных закупках, высока вероятность того, что коллекции с высоким сродством будут куплены вместе. Мы показываем связанные коллекции, когда пользователь добавляет товар в корзину, тем самым выражая намерение совершить покупку. Это помогает увеличить размер корзины покупателя.
Повышение вовлеченности после покупки : После того, как пользователь завершил свою покупку, мы используем соответствующие данные коллекций для отображения контента, который, вероятно, будет поддерживать заинтересованность пользователя из-за его высокой привязанности к недавно приобретенная коллекция. Эти коллекции отображаются как часть ленты главной страницы при следующем посещении клиента или отправляются в виде push-уведомлений.

Межкатегориальное обнаружение : когда покупатель заходит на страницу элемента, мы называем его коллекцию основной коллекцией. Перейдя на основную коллекцию, используя данные связанных коллекций, пользователь может открыть для себя всю широту нашего каталога и изучить контент, близкий к его основной цели.
Увеличение результатов поиска : Когда пользователь запускает узкие поисковые запросы, набор соответствий, полученный традиционной поисковой системой, невелик, и этот первоначальный набор результатов дополняется с помощью связанных данных коллекций. Это помогает ей находить коллекции, которые могут быть ей интересны, но не были указаны с помощью явного поискового запроса. Например, когда пользователь задает запрос «Сумки Puma», в наиболее подходящей коллекции сумок Puma может быть очень мало предметов. Мы можем отображать связанные коллекции в дополнение к результатам обычного поиска.

Мы видим множество вариантов использования, в которых можно использовать коллекции в зависимости от того, в какой части пути находится пользователь, начиная с удовлетворения потребности пользователя, выраженной в форме явного запроса, что приводит к формированию намерения покупки, а также к ретаргетингу после покупки. Мы экспериментировали с показом этих коллекций на протяжении всей пользовательской воронки и заметили рост числа повторений и конверсий.

Чтобы еще больше повысить эффективность, мы хотим ослабить текущее определение коллекции, которое ограничивает ее одной категорией, и вместо этого создавать коллекции, ориентированные на тему, охватывающую несколько категорий. Примером может служить «Коллекция Дивали», от декораций освещения до праздничных подарков, или «Коллекция походов», охватывающая такие категории, как палатки для кемпинга и походная обувь.