Эта статья является частью серии Academic Alibaba и взята из статьи под названием Ускорение метаболизма в электронной коммерции с помощью разработки механизма подкрепления, написанной Хуа-Лин Хэ, Чун- Сян Пань, Цин Да и Ан-Сян Цзэн, принято на семинаре ACM SIGIR по электронной коммерции 2018. Полностью статью можно прочитать здесь.

Как и традиционная розничная торговля, электронная коммерция процветает за счет конкуренции между торговцами и поставщиками, стремящимися привлечь покупателей к своей продукции. Однако уникальной особенностью электронной коммерции является то, что платформы, на которых конкурируют онлайн-продавцы, — такие платформы, как Amazon Джеффа Безоса и Taobao от Alibaba, — сами являются заинтересованными сторонами, ресурсы, которые они могут предоставить там, где, по их мнению, это принесет наибольшую ценность.

В частности, платформы обеспечивают видимость продуктов, которые, по их мнению, будут хорошо продаваться, выделяя им большее количество потребительских впечатлений, в частности, отдавая приоритет показу продуктам с высоким рейтингом кликов (CTR). Поскольку платформы получают прибыль как часть каждой продажи, способность эффективно распределять показы означает возможность максимизировать доход, который данный продукт принесет через их рынок, не только сразу, как сейчас показывают исследователи Alibaba, но и на протяжении всего его жизненного цикла. .

Чтобы включить более интеллектуальный механизм распределения показов, члены технической команды Alibaba разработали новый механизм обучения с подкреплением для оптимизации распределения показов на каждом этапе жизненного цикла продукта: внедрение, рост, зрелость и упадок. Основываясь на оценках в смоделированной среде электронной коммерции, их работа показывает, что способность распознавать горячие продукты на ранних этапах их появления и прогнозировать их снижение по мере их старения может помочь платформам увеличить «метаболизм» потребления за счет стратегического распределения показов с течением времени.

Помимо других проблем, команда преодолела предвзятое отношение к продуктам на этапе внедрения, отойдя от традиционных моделей обучения с учителем для оптимизации CTR. В этих моделях низкий объем данных CTR, доступных для новых продуктов, может быть ошибочно принят за признак низкой эффективности, что снижает вероятность того, что они будут выбраны для стратегий распределения показов, которые могут увеличить их метаболизм в системе. В целом, подходы к обучению с учителем, как правило, улучшают краткосрочный CTR, но не учитывают многие факторы, влияющие на долгосрочную эффективность, такие как изменения коммерческой активности с течением времени и свойства самих платформ. Учитывая масштаб таких платформ, как Taobao, на которых размещаются миллионы клиентов, предприятий и поставщиков услуг, методы, которые чрезмерно упрощают эти переменные, как правило, плохо масштабируются в сценариях реальных приложений.

Для своего нового подхода команда Alibaba сначала разработала математическую модель стадий и переходов жизненного цикла продукта, которую она применила к своим алгоритмам, объединив абстрактную экономическую теорию с основой в вычислительных показателях. Затем он применил эти термины в структуре обучения с подкреплением, предназначенной для максимизации краткосрочной и долгосрочной отдачи от своей смоделированной платформы, включая первую перестановку на основе основных компонентов с новым методом генерации опыта для удовлетворения требований масштабируемости сценариев электронной коммерции.

Основанный на методе проб и ошибок, этот механизм позволял платформе отслеживать глобальную информацию обо всех продуктах, распределять показы в соответствии с этими наблюдениями и заданной стратегией, а затем обновлять себя новыми атрибутами продуктов и их жизненным циклом. Затем механизм получил обратную связь об эффективности своих действий, что позволило ему скорректировать свою стратегию перед повторением процедуры. С конечной целью как можно быстрее довести продукты до стадии зрелости их жизненного цикла, этот механизм оказался способным улучшить долгосрочную эффективность распределения показов и генерировать прибыль для платформы более эффективно, чем конкурирующие подходы.

Полностью статью можно прочитать здесь.

Алибаба Тех

Подробная информация о новейших технологиях Alibaba из первых рук → Facebook: Alibaba Tech». Твиттер: «AlibabaTech».