Предсказание ответа пользователя - центральная проблема вычислительной рекламы. Количественная оценка намерений пользователей позволяет рекламодателям нацеливать рекламу на нужных пользователей. Это приводит к разумному использованию маркетинговых долларов, а также обеспечивает приятный пользовательский опыт.

Существующие классификаторы, такие как машины логистической регрессии и факторизации, которые получили широкое распространение для решения задач прогнозирования ответов, предполагают, что пользовательские сигналы являются абсолютной истиной.

В этой статье мы описываем подводные камни такого подхода и отстаиваем необходимость в классификаторах, которые моделируют собственный шум и неопределенность в пользовательских сигналах и работают изящно даже в худшем случае.

Наша работа под названием Надежные машины факторизации для прогнозирования реакции пользователей, принятая на конференции WWW’18, является попыткой рассматривать неопределенность данных как первоклассный гражданин в настройке классификации.

Чтобы изучить надежные машины факторизации на более глубоком уровне, обратитесь к этому блогу.

Понимание рекламной экосистемы

Пользователи обычно взаимодействуют с приложением или веб-сайтом рекламодателя, выполняют некоторые действия, такие как просмотр товаров, добавление в корзину, и могут уйти, не совершая покупки.

Чтобы повторно привлечь пользователей, рекламодатели делают ставки за пользователей в открытой сети, чтобы показать им персонализированную рекламу. Эта ставка рассчитывается как функция склонности пользователя кликнуть или совершить конверсию при показе объявления.

Прогнозирование ответа пользователя, общий термин для прогнозирования конверсии или клика, обычно формулируется как задача двоичной классификации с учетом сигналов активности пользователя на сайте и связанного контекста.

Прогнозирование конверсии (моделирование CVR): купит ли пользователь, если ему будет показан показ рекламы?

Прогнозирование кликов (моделирование CTR). Нажимает ли пользователь на показ объявления?

Уровень развития

Логистическая регрессия (LR) была предпочтительным алгоритмом классификации для прогнозирования ответа, поскольку он масштабируемый и дает интерпретируемые модели. Обратной стороной использования LR является то, что эффект взаимодействия функций не фиксируется. Например, если «пользовательское устройство = мобильный» и «категория = одежда» является сильным индикатором покупки, модель LR не сможет зафиксировать эту связь в своих весах характеристик.

Машины факторизации (FM), предложенные Штеффеном Рендлом, позволяют фиксировать взаимодействия функций в скрытом пространстве. То есть для каждого признака изучается p -мерный вектор, и сходство между двумя признаками определяется скалярным произведением этих скрытых векторов.

Машины факторизации и их варианты продемонстрировали превосходные характеристики на нескольких соревнованиях Kaggle. Criteo и Adroll также сообщили о превосходных показателях по производственным данным.

Почему надежность?

Файлы cookie и идентификаторы устройств - это основные идентификаторы, с помощью которых рекламодатель может получить доступ к предыдущим действиям пользователя на сайте.

В идеале рекламодатель имеет полное представление об активности пользователя для определения вероятности покупки / клика. Однако пользователи заходят на сайт рекламодателя через несколько точек соприкосновения. И разные аватары пользователя могут иметь разные шаблоны просмотра.

Например, тот же пользователь A может посетить приложение рекламодателя через мобильное устройство, а через некоторое время просмотреть другие продукты на компьютере. Однако для рекламодателя есть два частичных представления A1 и A2 для одного и того же пользователя. На мобильном устройстве рекламодатель может увидеть периодический шаблон просмотра, указывающий на обычный браузер, в то время как тот же пользователь может показаться заядлым покупателем на настольном компьютере.

К дополнительным факторам, вызывающим шум, которые приводят к искажению представления пользователей со стороны рекламодателя, относятся:

- Высокий процент оттока файлов cookie.

- Переменная скорость сетевого подключения.

-Нюансы работы системы.

Рекламодатель имеет фрагментированный взгляд на пользователя из-за факторов, описанных выше. При проведении торгов рекламодатель будет использовать сигналы только от одного из этих частичных представлений пользователя для вычисления вероятности ответа. Если бы рекламодатель знал консолидированное представление пользователей, прогноз ответа был бы более точным.

Насколько серьезна проблема?

В исследовании Criteo подчеркивается, что почти 31% онлайн-транзакций осуществляется с использованием двух или более устройств и что путь покупателя и коэффициент конверсии увеличиваются примерно на 40% при использовании представления, ориентированного на пользователя, по сравнению с частичным Представление, ориентированное на устройства.

Следовательно, очень важно моделировать эту потенциальную неполноту пользовательских сигналов, доступных рекламодателю. Однако существующие алгоритмы, используемые для прогнозирования отклика, предполагают, что пользовательские сигналы точно известны и чувствительны к любым возмущениям во входных сигналах.

Поскольку полная консолидация профилей пользователей остается открытой проблемой, классификаторам придется активизировать и моделировать неопределенность данных.

Хорошие новости..

Робастные машины факторизации (RFM) и робастные машины факторизации с учетом поля (RFFM), предложенные недавно на WWW 2018, моделируют неопределенность данных, используя принципы робастной оптимизации. Общая идея состоит в том, чтобы изучить классификатор, который демонстрирует устойчивость к шуму за счет минимизации потерь наихудшего случая. Загляните в наш блог, чтобы получить интуитивное представление о надежных машинах факторизации.

В конце концов..

Прочность - желаемое свойство. Не только для вычислительной области рекламы, где наличие нескольких точек соприкосновения делает устойчивость к шуму обязательной, но также и в любой чувствительной к шуму области.

RFM и RFFM - это общие предикторы, которые можно использовать для любой задачи классификации.

Что дальше?

Надежные классификаторы придерживаются довольно консервативной точки зрения при моделировании потерь наихудшего случая. Можем ли мы использовать некоторую парадигму, которая использует распределение данных, чтобы узнать основную неопределенность? Надежность распределения и надежная оптимизация на основе данных - два интересных направления, которые можно исследовать для этого.