Прескриптивная наука о данных: помимо прогнозной науки о данных

(1) Описательная, предсказательная и предписывающая наука о данных

(2) Необходимые наборы навыков для преуспевания в предписывающей науке о данных

(3) ключевые компоненты предписывающей науки о данных и распространенные заблуждения

По мере того, как компании становятся более зрелыми в области науки о данных, прогнозная наука о данных становится все более актуальной. Прескриптивная наука о данных приобретает все большее значение в выделении лидеров в области науки о данных и искусственного интеллекта среди других компаний. В этой статье я рассмотрю (1) различные типы науки о данных и их актуальность для организационной зрелости в науке о данных и аналитике, (2) необходимые наборы навыков, чтобы преуспеть в предписывающей науке о данных, и (3) ключевые компоненты предписывающей науки о данных. наука о данных и распространенное заблуждение.

1. Путешествие в науку о данных - описательное, прогнозирующее, предписывающее

Потребности бизнеса в различных типах науки о данных меняются по мере развития аналитической зрелости организации. Первоначально основное внимание уделяется обеспечению большей «фактологической базы» для повседневного принятия бизнес-решений. Соответствующий бизнес-вопрос: «Что случилось?» или "Что происходит?" Например, розничный торговец в прошлом проводил много различных видов рекламных мероприятий, и эта компания хотела бы знать, какова рентабельность каждого рекламного мероприятия и какие виды рекламных акций приносят больше дополнительной прибыли.

Когда организация становится более зрелой в аналитическом плане в своем путешествии по науке о данных, бизнес-вопросы превращаются в планирование на будущее. Бизнес-вопрос здесь: «Что произойдет с Y, если мы изменим X?» Например, розничный торговец планирует промо-акции «Черную пятницу», и эта компания может рассмотреть набор вариантов продвижения в качестве кандидатов. Прогнозная наука о данных может помочь делать прогнозы при различных сценариях продвижения.

Возможности прогнозирования - это здорово, но большинство организаций понимают, что существует слишком много вариантов, которые нужно учитывать. На этом этапе бизнес-вопрос: «Что нам делать (среди вариантов X)?» Например, розничный торговец хотел бы иметь механизм рекомендаций по продвижению, который дает рекомендации о том, какое рекламное мероприятие проводить (например, Купите 2, получите 1 скидку 50%), с каким уровнем скидки (50% против 30%) и в какое время (2-я неделя июля), в каком месте (Денвер) и какие продукты (Coca Cola Regular 2L Single Bottle).

На приведенном ниже графике представлена сводная информация о путешествии по науке о данных с организационной зрелостью и наукой о данных. Обратите внимание, что соответствующие наборы инструментов для анализа данных также меняются в ходе этого пути, как показано на этом графике.

2. Наука о данных: обязательные наборы навыков

Какие навыки требуются от специалистов по данным, когда компании все больше и больше сосредотачиваются на «предписывающей науке о данных»? Многие читатели, возможно, уже знакомы с 3 кругами требований к навыкам для специалистов по обработке данных: (1) знание предметной области, (2) статистика / машинное обучение (ML) / искусственный интеллект (AI) и (3) разработка программного обеспечения. С «предписывающей наукой о данных» требуется дополнительный навык «оптимизации», чтобы быть более эффективными специалистами по данным. «Оптимизация» обычно относится к сфере «Исследования эксплуатации» или «Промышленное проектирование». Обратите внимание, что типичные учебные программы по науке о данных не охватывают эту тему подробно. Визуализация ниже показывает 4 основных аспекта требований к навыкам для следующего поколения специалистов по данным, с более подробной информацией по каждому параметру.

3. Ключевые компоненты предписывающей науки о данных и распространенные заблуждения

Что такое «оптимизация»? Каковы ключевые компоненты «(математической) оптимизации» для предписывающей науки о данных? Есть много путаницы в определении понятий «предписывающая наука о данных» или «оптимизация». Если читатели еще не очень хорошо знакомы с (математической) оптимизацией, я описываю ключевые компоненты оптимизации ниже. Кроме того, я также показываю, что не является «предписывающей наукой о данных».

(1) Цель (функция): это количественный показатель эффективности, который компания использует для оценки бизнес-результатов. В большинстве случаев общая прибыль (т. Е. Чистая прибыль) и общий доход (т. Е. Верхний доход) являются частыми кандидатами в качестве цели оптимизации. Однако другие бизнес-метрики, такие как жизненная ценность клиента, могут быть рассмотрены в зависимости от соответствующего временного горизонта и характера бизнес-вопросов. Также обратите внимание, что можно иметь несколько целей разной важности (например, 80% прибыли + 20% дохода).
(2) Переменная решения: это набор переменных, которые компания может изменять. Например, в «совместной оптимизации цен» (т. Е. Оптимизации ценообразования) для розничных торговцев набор цен на 10 товаров в данной категории (например, конфеты) является примером переменных решения.
(3) Ограничения. Часто у предприятий есть набор бизнес-правил или защитных ограждений, которые необходимо учитывать, чтобы дать окончательную рекомендацию для деловых действий. Эти правила очень часто применяются после первоначальной попытки оптимизации, что приводит к неожиданным последствиям, приводящим к отмене результатов оптимизации. Более правильный способ - включить этот набор правил в качестве «ограничений» в ограниченную оптимизацию. Эти правила могут вводиться как ограничения «верхняя / нижняя граница», ограничения «равенства» или «ограничения неравенства». Например, в задаче «совместной оптимизации цен» группе товаров может потребоваться одна и та же цена из-за договорного соглашения между розничным продавцом и производителем или из-за необходимости упрощения принятия бизнес-решений - так называемого « линейное ценообразование ». Это правило линейного ценообразования может входить в качестве ограничений «равенства» для задач «оптимизации ценообразования с ограничениями». Если цена продукта 1 должна совпадать с ценой продукта 2, это можно указать как: цена (продукт 1) = цена (продукт 2). Если розничный торговец не хочет увеличивать цену более чем на 10% по сравнению с текущим уровнем цен, это может входить в качестве верхней границы повышения цен: то есть цена (продукт 1) ≤ 1,10 x текущая цена (продукт 1).

На рисунке ниже представлены основные компоненты «предписывающей науки о данных» (т.е. математической оптимизации). Кроме того, здесь также показано, «что есть, а что нет».

Надеюсь, эта статья поможет вам лучше понять путь науки о данных с организационной зрелостью с наукой о данных, дополнительным набором навыков для предписывающей науки о данных, каковы ключевые компоненты «прогнозной науки о данных», а что нет. В следующей статье я дам обзор различных типов методов оптимизации и доступных математических и аналитических методов. Если вы специалист по данным Python, хорошей отправной точкой для «предписывающей науки о данных» является библиотека SciPy.optimize.

SciPy.Optimize Link

Оптимизация (scipy.optimize) - Руководство SciPy v1.7.0
Пакет scipy.optimize предоставляет несколько часто используемых алгоритмов оптимизации. Подробный список… docs.scipy.org

Прескриптивная наука о данных: помимо прогнозной науки о данных

Вопросы по теме