Facebook, Twitter, Pinterest, Netflix, YouTube, Amazon - все они курируют контент в своих домашних лентах, собирая мою историю кликов, время просмотра и покупки, чтобы наводнить мою голову тонко настроенным подмножеством человеческих знаний. Знания, оптимально созданные для возбуждения нейронов, соединяющих мою зрительную и моторную кору. Просмотрите миниатюру, нажмите, потребляйте. Повторить.

Нам нужны усовершенствования в исследовательских алгоритмах в сочетании с культурными изменениями, чтобы оценивать и вознаграждать исследования. Было бы больно знакомить меня с идеями и точками зрения, которых я никогда не видел и не понимал. Но я застрял в локальных минимумах, в пузыре фильтров.

Это призыв к исследованиям.

Создание современного фида

Учитывая негативную прессу, которую получает Facebook, легко возложить вину на руководителей; выставляя их козлами отпущения как личностей, которые целенаправленно раскалывают Америку и показывают нам всем политически заряженные истории и рекламу. Но потратив некоторое время на изучение и построение рекламных систем и систем ранжирования каналов, я не думаю, что они полностью виноваты. Пузырьки фильтров - это естественные сегменты человеческих идеологий, которые автоматически идентифицируются и используются продуктами, созданными с использованием машинного обучения, оптимизированными для максимального краткосрочного участия человека.

Я не буду вдаваться в подробности того, как проектировать такие системы, так как я писал ранее по этому поводу, а исследователи с гораздо большим опытом публиковали их в течение многих лет. Но сокращенная версия: создание ленты для продукта, ориентированного на потребителя, состоит из трех шагов:

  1. Определите краткосрочные и долгосрочные цели. Долгосрочные цели отражают ключевые показатели эффективности компании: доход (от рекламодателей или регистраций), жизненная ценность клиента, создание качественного контента. Краткосрочные цели легче измерить с помощью A / B-теста продолжительностью от недели до месяца: клики, голоса за, против, время, потраченное на просмотр видео, показатели, которые коррелируют с долгосрочными целями.
  2. Соберите все возможные данные о ваших пользователях, вашем контенте и ваших производителях контента. Изучите демографические данные пользователей, предпочтения пользователей, включая друзей, отслеживаемые страницы, отмеченные местоположения, покупки и т. Д. Авторы или продавцы на вашей платформе узнают их репутацию на платформе, их целевую аудиторию, их бренд.
  3. Постройте модель ранжирования. Используйте машинное обучение, чтобы объединить 1. и 2. путем оценки вероятности достижения пользователем краткосрочной цели по части контента. Оцените эту вероятность для такого количества контента и стольких целей, насколько это возможно с вычислительной точки зрения, учитывая время загрузки сайта и требования к стоимости. Затем сортируйте.

Фильтр пузырьков

При оценке с помощью такой системы ранжирования контент примерно попадает в одну из трех категорий: уверенно хороший, уверенно плохой или неуверенный. Учитывая, что я смотрю видео с комедийными подкастами, YouTube уверен, что мне понравятся новые подкасты, созданные тем же комиком. Учитывая, что я купил книгу по инженерному менеджменту, Amazon уверен, что я не куплю ту же книгу по инженерному менеджменту. А учитывая, что я никогда не видел сообщений из Starbucks, Facebook вряд ли будет уверен, что мне нравится или не нравится Starbucks.

Конечный результат: на каждой крупной веб-платформе я вижу контент, отсортированный по моделям ранжирования, основанным на уверенности модели в том, что я буду нажимать, читать, смотреть или покупать контент.

И все же я вижу такую ​​узкую часть каждого веб-сайта. В мире * столько * контента. У Facebook миллиарды пользователей и страниц, у Amazon - миллионы продуктов, у YouTube - сотни часов видео, загружаемых каждую минуту. То, что я так мало вижу, это проблема пузыря фильтра.

Используя 1–3 выше, каналы создаются машинным обучением, инженерами, разработчиками продуктов и руководителями, объединившись и стремясь максимизировать KPI, установленные правлением организации. Такое объединение целей, от собрания совета директоров до модели ранжирования, - чрезвычайно эффективный способ развития организации. Он обеспечивает ясность и направление, инкапсулирует роль команды и создает объективные измерения успеха или неудачи при запуске. Системы, построенные вокруг идеалов максимизации KPI, способствуют быстрому росту. Лента Netflix принесла конверсию более миллиарда долларов, а Facebook - почти 13 миллиардов доходов от рекламы в прошлом квартале. Неудивительно, что при наличии достаточного количества данных и достаточно сложных алгоритмов системы машинного обучения эффективно находят локальный минимум: небольшую группу контента, с которой пользователь будет уверенно взаимодействовать.

Но этот итерационный цикл build = ›test против KPI =› launch способствует росту пузырей фильтра; мы видим только эти локальные минимумы. Нам нужно больше исследований.

Исследование содержания

Стоимость исследовательских моделей при ранжировании может быть значительной; такие модели обязательно снижают КПЭ. Это следствие гипотезы о том, что машинное обучение находит оптимальный контент для удовлетворения пользовательского поведения для заданного ключевого показателя эффективности. Например, добавление совершенно случайных видео в мой канал YouTube, который был тщательно отобран, чтобы максимизировать мою вероятность нажатия на видео, почти наверняка уменьшит количество моих кликов. Просто они мне не нравятся так сильно, как комедийные подкасты.

И есть попытки сделать именно это. Такие сайты, как Forgotify, сайт для поиска забытых треков на Spotify или YouTube Roulette: случайный подход к поиску новых видеороликов на Youtube или Amazon’s Stream для просмотра случайных, модных продуктов. Это забавные сайты, которыми я наслаждаюсь несколько минут. Но случайная выборка контента неэффективна. Для эффективности необходимо больше знать о пользователе, о контенте и о нашем мире.

Что касается эффективности, я хотел бы получить больше ответов на эти вопросы:

  • Какие KPI подходят для геологоразведочных работ?
  • Как нам найти компромисс между исследовательскими ключевыми показателями эффективности и кликами, голосами за и покупками?
  • Существуют ли улучшения Парето или это перетягивание каната?
  • Какие алгоритмы эффективно выбирают пространство для миллиардов фрагментов контента?

Не ответив на эти вопросы, мы не можем надеяться обучить алгоритмы показывать нам контент, который доставляет удовольствие, выходит за пределы нашей непосредственной зоны комфорта и по-прежнему полезен для организации ленты. У меня нет немедленных ответов на эти трудные вопросы.

У меня просто этот призыв к дальнейшим исследованиям.

Выраженные мной мнения являются исключительно моими и не отражают взгляды или мнения какого-либо бывшего или нынешнего работодателя