Введение в ценности Шепли II: глубокое погружение в бизнес-приложения

Добро пожаловать в мой второй пост об одном из самых крутых решений кооперативных задач, которые я видел за последнее время. По правде говоря, я не проверяю их так много, как можно было бы ожидать от парня с блогом, но даже в этом случае никто не может лишить их крутости.

Если вы понятия не имеете, о чем был первый пост по теме, я подробно объяснил, что такое значения Шепли и как они рассчитываются с их формулой и примером. Здесь я дам вам небольшое трехстрочное определение и вместо этого сосредоточусь на том, для чего именно они используются в бизнесе и на их потенциале.

Итак, давайте дадим вам краткое объяснение:

Ценность Шепли — это концепция решения, используемая в теории игр, которая справедливо распределяет выгоды и затраты между несколькими участниками, работающими в коалиции.

По сути, это метод расчета того, насколько важен конкретный игрок или реальность во влиянии на результат зависимой переменной, в ситуации, когда другие игроки и реальности, которые также могут быть измерены, также влияют на указанный результат, эти игроки или реальности «сотрудничают» путем существуют вместе вокруг проблемы и могут возникать в различных сочетаниях, которые мы называем «коалициями».

Я начинаю увлекаться определением, потому что мне действительно нравится говорить об этом, поэтому я просто оставлю это, проверьте другой пост для более подробной информации. Я очень рекомендую это. Вместо этого я сосредоточусь на том, какие приложения и ценность он предоставляет для бизнеса.

Оглавление:

− Для чего используются значения Шепли?
− Самый популярный вариант использования: важность функции в машинном обучении
− Маркетинговые модели атрибуции
− Распределение рисков
−− Проблема отслеживания отдельных игроков
−− Проблема измерения риска
− Анализ социальных сетей
− Распределение ресурсов
− Заключительные замечания

Для чего используются значения Шепли?

Самый популярный вариант использования: Важность функции в машинном обучении.

Итак, это самое интересное: в целом ценности Шепли стали очень популярными с появлением MLOP (машинное обучение с большим акцентом на продуктизацию) и их использование для облегчения так называемого «объяснимого ИИ». По сути, рассматривая различные функции, которые мы используем для прогнозирования или расчета конкретной целевой переменной, как игроки, можно получить важность каждой из этих функций для воздействия на указанную переменную.

Его крутость заключается в том, что он использует вероятностный подход, основанный на проверке всех различных комбинаций указанных функций для этой цели. Этот вероятностный подход позволяет решению быть эффективным независимо от того, насколько «черным ящиком» является алгоритм машинного обучения. По сути, это способ оценить приблизительный (но недостаточно надежный, чтобы считаться статистически значимым) причинно-следственный эффект различных функций на цель, который полностью не зависит от самого алгоритма. Это работает одинаково с глубокой нейронной сетью или с линейной регрессией.

Это позволило специалистам по данным и владельцам их бизнеса, которые хотят убедиться, что у них нет расистского или нелогичного для бизнеса решения, лучше понять, почему прогнозы модели действительно выполняются, без необходимости идти на компромисс с более простыми алгоритмами, которые допускают логические способы. расчет указанной важности. Без значений Шепли для понимания ИИ вам пришлось бы использовать более простые (хотя и очень мощные) алгоритмы, такие как линейная регрессия или случайный лес, чтобы иметь приблизительную важность признаков. С Shapley вы можете сойти с ума, загадывая свой алгоритм и применяя причудливые и непонятные математические трюки, чтобы увидеть, сходится ли он лучше.

Их основная проблема заключается в вычислительных затратах, чем больше у вас функций, тем сложнее их вычислить. Но это тема для другого дня.

Несмотря на то, что это основное использование, которое популяризировало решение, существуют и другие популярные основные приложения для значений Шепли, и не очень популярные, мы проверим все, что я смог найти здесь.

Модели маркетинговой атрибуции

Второй наиболее популярный вариант использования прямо сейчас (хотя раньше он был первым до появления MLOps) — более естественный вывод, основанный на том, как они изначально задумывались. Модели атрибуции — это метод придания в маркетинге, и особенно во входящем маркетинге, особой важности различным маркетинговым каналам в превращении потенциальных клиентов в клиентов на пути пользователя. Это особенно полезно для принятия решения об оптимизации бюджета и стратегии в указанных каналах. Понимание, в каких источниках трафика компания сильнее или слабее и т.д.

Например, представьте, что я использую рекламу в Facebook, Google AdWords и контент на YouTube для взаимодействия со своей аудиторией и могу отслеживать, когда конкретный человек взаимодействует с любым из этих трех каналов. Когда конкретный клиент видел только один канал, совершенно ясно, какой из них был наиболее важным для создания этой конверсии, но что произойдет, если он проверит три из них перед конверсией? Кто из них был действительно ответственным? Обычно в бизнесе рассматриваются различные методы атрибуции, такие как атрибуция первого или последнего касания, где либо первый маркетинговый канал, либо последний перед продажей имеют наибольшее значение, или, например, просто придание каждому каналу одинаковой важности. .

Суть этих методов в том, что они упрощают ту бизнес-реальность, это можно рассматривать как очень наивный подход, он предполагает отсутствие эвристической разницы в качестве исполнения каждого канала и их эффективности, что просто не соответствует действительности. Со значениями Шепли можно рассчитать самое близкое приближение к истинной важности, различные каналы рассматриваются как игроки, и, изучая, как разные пользователи конвертируются в зависимости от доли каждого потребляемого ими канала, путем повторения всех комбинаций доставки много раз, с помощью закона больших чисел можно получить достоверную аппроксимацию важности канала. Эта важность, как объяснялось ранее, становится очень полезной, чтобы помочь решить, какие каналы оптимизировать и как это сделать.

Это еще один очень популярный вариант использования значений Шепли, и его реализацию вместе с важностью функций можно легко найти с помощью многочисленных примеров в поиске Google. Теперь давайте посмотрим на не очень распространенные варианты использования:

Распределение рисков

Творческое применение значений Шепли может заключаться в определении того, как различные активы, будь то акции или люди (например, на страховом рынке), влияют на общий риск портфеля. Идея очень похожа на то, как она применяется для атрибуции или важности функции, хотя требует двух конкретных условий, которые трудно соблюсти в реальных сценариях для этого типа варианта использования.

Проблема слежения за отдельными игроками

Как уже упоминалось, значения Шепли зависят от того факта, что игра, в которой они применяются, имеет много раундов, в которых можно наблюдать различные комбинации указанных игроков, и генерировать целевую переменную. Обычно при работе с акциями или страховании людей они либо входят в состав портфеля, либо не входят в него, не переключаясь постоянно между двумя состояниями. Это означает, что я мог бы застраховать конкретного пользователя на 2020, 2021 и 2022 годы, но в тот момент, когда он останавливается, редко можно увидеть, как он возвращается после этого.

В этом смысле создание комбинаций, в которых разные игроки (либо акции, либо пользователи) приходят и уходят, не является обычным явлением. По этой причине необходимо эвристически или математически генерировать категории упомянутых пользователей и акций, чтобы инкапсулировать представление, которое можно увидеть в коалициях и вне их в различных ситуациях.

Если вместо того, чтобы иметь Генри Кавилла в качестве игрока, которому я хочу распределить риск, у меня есть сегмент клиентов компьютерных энтузиастов, мне будет намного проще генерировать необходимую информацию для получения значений Шепли. Чем проще метод, который вы используете для создания этого пользовательского представления, тем лучше. Та же идея применима к акциям, хотя там чаще можно увидеть конкретный актив в коалиции и вне ее в разные периоды времени.

Проблема измерения риска

Вторая проблема заключается в правильном измерении риска в целевой переменной, которая может быть легко агрегирована и разделена, но при этом применима к различным представлениям игроков. Мне очень легко ошибиться в измерении риска, просто взгляните на все финансовые кризисы в истории. В этом смысле бизнес-задачи, которые позволяют сделать риск достаточно простым, чтобы его можно было классифицировать с помощью, например, машинного обучения, более целесообразно использовать в этом смысле значения Шепли.

Если мы решим эти две проблемы, можно будет правильно применить значения Шепли для расчета риска различных элементов портфеля.

Вот несколько довольно интересных статей по этому вопросу, если вам интересно, каждая из которых посвящена различным частям упомянутых вопросов. [1],[ 2],[3],[4]

Анализ социальных сетей

Очень классное и интересное приложение, которое особенно эффективно для оптимизации стратегий вирусного роста, — это анализ влияния и социальной релевантности. По сути, создав метрику, которая количественно определяет, насколько вирусными или продвигаемыми являются конкретные слухи, мемы или сообщения, и изучая, какие влиятельные лица участвовали в распространении указанного сообщения, можно определить лидерство и актуальность социальной сети, чтобы понять, какие ее элементы самое важное. Это может дать сильную обратную связь при принятии решения о том, как оптимизировать и улучшить вирусный рост, например, путем создания конкретного сотрудничества с наиболее важными/эффективными влиятельными лицами в социальной сети.

Это же приложение можно применить к любому уровню социальных сетей и использовать для оптимизации других целевых переменных помимо вирусизации, например, продуктивности или важности принятия решений. Например, в конкретных исследованиях основное внимание уделяется применению этой идеи для изучения внутреннего командного лидерства в командах, где ротация между партнерами по работе является обычным явлением, или для изучения того, какие отделы внутри компании принимают более активное участие в принятии ключевых стратегических решений. Это особенно полезно в очень крупных компаниях с большим количеством жира, полученного из-за бюрократии. Измерение того, какие отделы или руководители внутри них больше всего участвуют в фактическом закрытии проблем и принятии окончательных решений, может помочь улучшить удержание сотрудников, вознаграждая или игнорируя определенные ключевые сотрудники.

Для приложений социальных сетей сложность заключается в создании данных и их получении, если в качестве источника используются социальные сети, это можно смягчить с помощью платного APIS, но при внутреннем анализе необходимо глубоко продумать архитектуру для сбора данных. . Кроме того, чем более абстрактна целевая переменная, которую игроки в коалиции попытаются увеличить (например, важность в принятии решений, а не виральность), тем больше риск теоретически облажаться.

Распределение ресурсов

Другое типичное использование - распределение определенного ценного и дефицитного ресурса среди группы, эта группа может быть частью организации, агентами в определенном обществе или организации и даже целыми городами в определенной стране или штате. Можно найти научную документацию по нескольким вариантам этой проблемы, например, для распределения запасов между многими магазинами определенной франшизы в зависимости от того, какой вклад внесли разные магазины. Здесь игроки — это сами магазины, а раунды — это бизнес-циклы, целевая переменная, на основании которой мы принимаем решение, может быть избыточным запасом или самими продажами.

Однако наиболее распространенная документация находится в правительственных приложениях, где значения Шепли используются для помощи в распределении ресурсов, таких как вода или энергия, между различными суборганизациями указанного правительства, штатами или жилыми единицами в районах. Когда мы наблюдаем основные проблемы этого варианта использования для значений Шепли, это имеет смысл;

И главная проблема, которую я наблюдал с этим приложением внутри бизнеса, заключается не столько в том, что оно не может работать, сколько в том, что есть гораздо лучшие варианты. Подумайте об этом, когда все игроки являются небольшими организациями, внутри вашей организации с, например, возможностями отслеживания данных, метриками, которые вы измеряете, вы можете настроить достаточно систем отслеживания метрик и того, как те элементы организации работали, что позволяют создавать более специфичные для бизнеса правила для распределения ресурсов и измерения их участия.

Зачем тебе использовать Шепли, если ты прекрасно контролируешь всех игроков? Знание инсайдерской информации, вероятно, позволяет вам эвристически создать формулу, более специфичную для проблемы, которая глубоко понимает тонкости проблемы и рассматриваемого бизнеса. Однако в этом смысле решение, основанное на значениях Шепли, может служить первым наивным подходом к проблеме и базой для дальнейшего улучшения.

Шепли кажется несовершенным решением, которое может иметь смысл только тогда, когда игроки, распределяющие указанные ресурсы, независимы и не очень сотрудничают с самого начала. Например, сотрудничество между конкурентами, объединяющими ресурсы.

Это основная причина, по которой имеет смысл сделать его гораздо более популярным в государственных приложениях, выполняя те типы условий, в которых сотрудничество существует, но недостаточно для сбора необходимых данных для более точного решения (обычно из-за неэффективности правительства). Однако это также не без проблем, количественная оценка городов, штатов и тому подобного затруднена, не все игроки начинают в симметричных условиях, и поэтому риск альтернативных издержек, связанных с их участием, не учитывается моделью Шепли, которая становится особенно упрощенной. для этой цели, если, например, игрокам необходимо доставить прибыль или полезный ресурс, то же самое можно сказать и о сотрудничестве между конкурентами. По крайней мере, в этом сценарии простота решения и отсутствие прозрачности в сборе данных между игроками (следовательно, отсутствие лучших вариантов) делают этот подход предпочтительным по сравнению с другими альтернативами.

Заключительные примечания

Вот основные варианты использования, которые я нашел для значений Шепли, одна особая вещь, которую я заметил, это то, как вариант использования важности функции дает такой большой потенциал, давая более глубокое понимание бизнес-моделей, например, вариант использования важности функции может выйти за рамки только самого машинного обучения, если система машинного обучения является частью динамической модели, которая пытается имитировать всю бизнес-реальность или причинно-следственный график. В этом смысле возможности объяснимости выходят за рамки только понимания того, как работает конкретный алгоритм машинного обучения, но также и того, как работает сам бизнес. В этом смысле эти различные варианты использования могут быть расширены до более сложных в сочетании с другими математическими инструментами, такими как моделирование. [1].

Если есть какие-либо другие варианты использования, которые, по вашему мнению, стоит упомянуть, не стесняйтесь обращаться к нам! Я полностью открыт для обратной связи.

Первоначально опубликовано на https://mathforbusiness.com 30 мая 2023 г.