Как убедиться, что ваш проект стартует успешно

Перед началом каждого проекта важно задавать вопросы, которые помогут вам понять, над чем вы будете работать в течение следующих нескольких недель или даже месяцев. Такие вопросы, как чего мы пытаемся достичь, почему мы пытаемся достичь и как это принесет пользу конечному пользователю, действительно важно задать в начале проекта, поскольку они необходимы для достижения успешных результатов и внесения ясности в процесс. проблема, которую вы пытаетесь решить.

Вот список вопросов, которые вы должны задать перед началом вашего проекта по науке о данных:

  1. Кто является клиентом, в какой сфере деятельности находится клиент?

Понимание того, в какой области бизнеса находится клиент, как он работает, что для него важно, какие ключевые переменные используются для определения успеха в этой области, позволит вам создать решение, которое напрямую повлияет на то, что важно для клиента.

2. Какую бизнес-проблему мы пытаемся решить?

В книге Основы машинного обучения для прогнозной аналитики данных это прекрасно описано:

Организации не существуют для прогнозной аналитики данных. Организации существуют для того, чтобы зарабатывать больше денег, привлекать новых клиентов, продавать больше товаров или сокращать убытки от мошенничества. К сожалению, модели предиктивной аналитики, которые мы можем построить, не делают ничего из этого. Модели, которые строят практикующие аналитики, просто делают прогнозы на основе шаблонов, извлеченных из наборов исторических данных. Эти прогнозы не решают бизнес-проблем; скорее, они дают информацию, которая помогает организации принимать более эффективные решения для решения своих бизнес-задач.

Таким образом, ключевым шагом в любом проекте по анализу данных является понимание бизнес-проблемы, которую организация хочет решить, и, исходя из этого, определение типа информации, которую может предоставить модель прогнозной аналитики. помочь организации решить эту проблему. Это определяет аналитическое решение, которое специалист по аналитике намеревается создать с помощью машинного обучения [1].

Если целью вашей компании является снижение уровня оттока клиентов, одним из возможных решений может быть создание модели прогнозирования, которая будет определять, какие клиенты с наибольшей вероятностью уйдут в ближайшем будущем.

3. Как это будет потребляться покупателем?

Понимание того, как ваш клиент будет использовать результаты вашей модели, позволит вам создать свою работу, ориентированную на него. Например, вы создаете модели, которые обслуживают внутренних пользователей и влияют на стратегию компании, или вы создаете модели, ориентированные на клиентов.

4. Каков экономический эффект от этого проекта?

Вложить в проект сумму в долларах — одна из самых сложных вещей. Но знание того, как ваш информационный продукт увеличит прибыль или снизит затраты для клиента, позволит вам заручиться поддержкой руководства и поддерживать вас на протяжении всего проекта.

5. Какие решения будут приниматься нашей функцией обработки данных?

Какая модель даст им возможность делать то, что они не могли делать раньше.

6. Какой показатель мы будем использовать, чтобы назвать этот проект успешным, и как мы будем его измерять?

Имея в виду конкретную цель, вы убедитесь, что ваш проект имеет конечный результат, и вы не работаете над ним бесконечно. Количественно определите, какое улучшение значений метрик полезно для сценария клиента (например, снижение трудозатрат на 20%). Метрика должна быть SMART (Sконкретная, Mизмеримая, Aдостижимая, R >уместно и времяпривязано). Например: достичь точности прогнозирования оттока клиентов на уровне 20% к концу этого 3-месячного проекта, чтобы мы могли предлагать рекламные акции для снижения оттока [2].

Представьте себе диалог между специалистом по данным (DS) и менеджером по продукту (PM) о внедрении новой функции машинного обучения в приложение, созданное для обеспечения большей прозрачности складских операций. Предположим, менеджер по продукту хорошо знает складское пространство и уже имеет в виду функцию.

DS: Я считаю, что клиент ABC столкнулся с проблемой. Не могли бы вы помочь мне понять, в чем проблема?

ПМ: Конечно. ABC постоянно пытается достичь своей цели по ежедневным заказам.

DS: Какова цель ежедневного заказа?

PM: Склады обычно в начале дня устанавливают цель заказа, который они пытаются отправить до конца рабочего дня. Например, в начале дня оператор на складе устанавливает цель заказа, скажем, 45 000 заказов, которые ему нужно отправить за дверь до конца дня.

ДС: Понятно! И почему достижение этой ежедневной цели важно для них?

PM: Хороший вопрос. Невыполнение дневной цели заказа означает несвоевременную доставку своим клиентам, что может привести к дополнительным затратам на поддержку, репутационному ущербу и оттоку нашего клиента. А чтобы облегчить жизнь клиентам, я предлагаю добавить в приложение функцию машинного обучения, которая поможет нашим клиентам лучше понять, находится ли он на пути к достижению своей цели по заказу сегодня, основываясь на текущей эффективности. .

ДС: Понятно. И почему вы думаете, что эта функция полезна для них? К каким решениям это приведет?

PM: Хороший вопрос. Одним из наиболее важных вариантов использования является то, что это позволит операторам на складе соответствующим образом распределять рабочую силу на раннем этапе. Например, если наш прогнозируемый заказ, отгруженный за день, ниже их дневной цели, они могут увеличить количество рабочих, чтобы перемещать вещи быстрее. Таким образом, это помогает им выполнять повседневные операции более эффективно.

DS: Как это будет использоваться клиентом?

PM: Позвольте мне на секунду поделиться своим экраном и показать вам. Пользователи смогут увидеть эту функцию в нашем приложении. Вот как я себе это представляю: синяя сплошная линия показывает заказ, который они отправили до сих пор. Зеленая пунктирная линия — это прогноз, полученный на основе нашей модели. И красная сплошная линия — их цель на сегодня.

ДС: А, это хорошее изображение — оно мне очень понятно. Значит, это будет функция в реальном времени, где мы будем обновлять прогнозы на день каждый час?

ПМ: Да. Правильно.

DS: Другой вопрос: что они используют в настоящее время и каково базовое (текущее) значение этой метрики?

PM: В настоящее время они ничего не используют, поэтому эта функция внесет большую ясность в их работу.

Д.С.: Каково экономическое влияние этого проекта? И каковы критерии успеха?

PM: Отличный вопрос. Что ж, если наши прогнозы имеют среднюю абсолютную ошибку менее 30% к концу этого двухмесячного периода, мы можем назвать первую итерацию этого проекта завершенной. Что касается экономического воздействия, по моей приблизительной оценке, эта функция также позволит им оптимизировать планирование ресурсов и решения о распределении, что поможет им снизить зависимость от рабочей силы и снизить затраты на 30%. Мне придется провести дополнительное расследование и подсчитать некоторые цифры, чтобы получить точную сумму в долларах.

DS: Похоже, эта функция повысит эффективность многих отделов нашего клиента. Позвольте мне изучить данные, а затем взять всю эту информацию и составить примерный план того, как я буду выполнять этот проект, и поделиться с вами и командой, чтобы получить обратную связь.

PM: Отлично! Спасибо.

В своей книге Предвидеть неудачу Лак Анант заявил, что «Каждый бизнес начинается с этого компонента проблемы, решения и почему это привлекательный бизнес». Точно так же проект по науке о данных должен начинаться с гипотезы о том, какую проблему клиента мы пытаемся решить, почему мы пытаемся ее решить и как это повлияет.

Ссылки

[1] Келлехер, Дж. Д., Наме, М. Б., и Д’Арси, А. Основы машинного обучения для прогнозной аналитики данных: алгоритмы, рабочие примеры и тематические исследования (2015). Пресс Массачусетского технологического института.

[2] Microsoft, Azure-TDSP-ProjectTemplate, (2021 г.)