Почти невозможно говорить о машинном обучении без таких модных словечек, как «глубокое обучение» и «нейронные сети». (Само «машинное обучение» можно считать модным словом). Скорее, я имею в виду, что я не буду просто следовать формуле громких заявлений - например, DeepMind (крупная исследовательская компания, занимающаяся тяжелыми технологиями) просто превзошла игру Go (вставьте впечатляющий тест k), поэтому мы думаем о той же технологии (почему бы и нет мы просто называем это «ИИ?») изменит цифровую рекламу (укажите любую отрасль).

Вместо этого я взгляну с высоты птичьего полета на текущие модели машинного обучения, используемые в рекламных технологиях и цифровой рекламе, и объясню, что они на самом деле делают. Стоит отметить, что по мере того, как нативная реклама становится нормой, мы увидим ограничения этих моделей. Затем я постулирую, как мы можем устранить эти ограничения с помощью современного машинного обучения, и изложу концепции машинного обучения для нативной рекламы в Qchain.

В большинстве известных мне случаев рекламные технологии фокусируются на аудитории и эффекте с целью оптимизации эффекта с помощью правильного аудитория. эффект здесь можно измерить множеством различных показателей: показами, рейтингом кликов и любыми другими показателями панели управления AdSense. Основная проблема заключается в том, что рекламодатель ограничен в ресурсах и не может показывать свою рекламу перед каждым человеком все время. Следовательно, они должны быть избирательными в отношении аудитории, которой показывается реклама.

Мы можем рассматривать машинное обучение adtech как проблему ограниченной оптимизации, которая, по сути, является любой проблемой машинного обучения. Поскольку AlphaGo также является моделью ограниченной оптимизации, где ограничениями являются правила игры и память, мы думаем, что она сможет решить цифровую рекламу. Но конечно нет. Причина в том, что мы не можем смоделировать все возможные сценарии рекламной кампании, такой как игра в го, при наличии набора явных правил. (Подождите ... Разве Илон Маск не говорил, что мы живем в симуляции?)

Но вернемся к актуальному вопросу: на кого из аудитории должен нацеливаться рекламодатель? Предположим, у нас есть данные об интернет-пользователях, собранные из браузеров и других источников, которые описывают их характеристики. Назовем данные X. Мы можем проанализировать распределение этих характеристик, P (X), и найти подгруппы пользователей, определяемые определенными характеристиками. Зная эти подгруппы, мы можем ориентироваться на одни, а не на другие. Этот вид машинного обучения называется кластеризацией при обучении без учителя. Вы можете использовать что-то простое, как k-means или потенциально глубокую нейронную сеть auto-encoder. Независимо от конкретной модели, она будет выполнять сегментацию аудитории.

Суть в том, что эти подходы к моделированию не учитывают * содержание * рекламы.

Помимо просмотра X, вы также можете иметь данные о эффекте, который мы назовем Y. Затем вы можете построить прогнозные модели для Y, используя X, моделируя условное распределение P (Y | X) . Опять же, есть много способов сделать это. Вы можете предположить, что все данные независимы, и построить модель, а затем развернуть ее. В качестве альтернативы вы можете рассматривать Y как временной ряд (поскольку данные предположительно собираются с течением времени) и пытаться фиксировать закономерности по дням, неделям и т. Д. Вы даже можете постоянно обновлять свою модель по мере поступления новых данных, что называется «онлайн-обучением». Возможные модели варьируются от регрессионных моделей (мультиномиальная логистическая регрессия делает классификацию с несколькими метками) до глубоких гауссовских процессов (гибридная глубокая нейронная сеть, которую, похоже, использует команда Ferrari Formula One).

Наконец, есть класс моделей, которые активно оптимизируют Y, например, многорукий бандит. Здесь нам нужно расширить наше определение X за пределы характеристик аудитории. Представьте себе рекламную кампанию в виде черного ящика с ручками. Некоторые из регуляторов связаны с характеристиками аудитории, в то время как другие регуляторы могут изменять формат рекламы (например, размер баннера) или распространение (например, время электронной почты). Модели, которые мы описали до сих пор, используют данные для изучения того, как ручки изменяют выходной сигнал черного ящика, тогда как алгоритм многорукого бандита буквально настраивает ручки в две фазы. На первом этапе исследования алгоритм пробует множество различных комбинаций настроек регуляторов. Затем, основываясь на результатах этих исследований, алгоритм «вероятностно» найдет (экстраполирует с некоторой неопределенностью) наиболее эффективные настройки регулятора на этапе эксплуатации.

Мы можем создавать графические и текстовые модели для анализа содержания нативной рекламы и содержания издателей в масштабе, чтобы найти наиболее подходящую.

Помимо ограничений конкретных моделей, слон в комнате заключается в том, что эти подходы к моделированию на самом деле не учитывают содержание рекламы. Это нормально для современной цифровой рекламы, потому что, как вы можете сказать (или как вы не помните), большинство объявлений (за исключением видео) довольно просты и похожи. Однако когда дело доходит до нативной рекламы, объявления намного богаче и разнообразнее по содержанию. Если мы думаем о тексте в традиционной рекламе, это, по сути, заголовки или короткие отрывки текста. С другой стороны, типичная спонсируемая статья на веб-сайте New York Times содержит значительно больше содержания. Мы считаем, что для того, чтобы получить представление о нативной рекламе, модели (и люди) должны уделять больше внимания содержанию рекламы - будь то интерактивная статья об иммиграции или функция на платных сопровождение , индивидуальная викторина по телешоу или другой формат.

Именно здесь на помощь приходит современное машинное обучение. (Фоновое приветствие толпы, ayyyye-eye.). Настоящий прогресс в машинном обучении заключается в том, что, помимо количественных и категориальных данных, мы теперь может создавать модели для изображений и текста. Эти модели могут распознавать объекты и обрабатывать язык на уровне среднего шестилетнего человека (да, «человеческий уровень»). Крупные технологические компании, многие из которых тоже занимаются рекламой, уже используют эти модели: например, теги друзей в Facebook и ответы Amazon. Мы считаем, что есть возможности использовать эти модели для нативной рекламы.

В частности, мы можем создавать графические и текстовые модели для анализа содержания нативной рекламы и содержания издателей в масштабе, чтобы найти наиболее подходящую. Кроме того, мы хотим строить эти модели открытым и понятным образом, а не просто использовать броское название, включающее «ИИ». Таким образом, Qchain надеется помочь как рекламодателям, так и издателям более эффективно достигать своих целей с нужной аудиторией, прокладывая путь к более аутентичному маркетингу.