Прогнозирование - ключевое слово у всех на устах. Будь то Нейт Сильвер предсказывает выборы в США (или нет), или Facebook вкладывает большие средства в VR, бизнес-решения должны основываться на мире завтрашнего дня, а не на мире сегодняшнего дня.

Прогнозная аналитика набирает обороты в деловом мире, и каждая компания хочет знать, что их клиенты будут делать дальше. Но как это сделать? Мы просмотрели 20 лучших результатов Google по запросу Прогнозирование поведения клиентов и нашли только расплывчатые подсказки и сложные научные статьи. В этой статье мы хотим предоставить конкретное пошаговое руководство по выполнению работы. Далее мы предлагаем 5-шаговое руководство по прогнозированию поведения клиентов с использованием методов науки о данных.

Шаг 1. Определите четкую цель

Для любого вопроса о прогнозировании самый важный шаг - начать с конкретной цели. Ваша цель должна быть в состоянии давать проверяемые прогнозы. Слишком расплывчато сказать Розничные покупки увеличатся. Когда они увеличатся? На сколько? Ваши предсказания должны пройти Тест на ясновидение. Лучшая цель - определить, какие клиенты сделают розничную покупку в течение следующих 14 дней с точностью 90%. Конечно, есть много других вариантов поведения, которые вы можете предсказать, например, отток клиентов, LTV или реакция на конкретную кампанию.

Шаг 2 - Соберите правильные данные

Теперь у вас есть цель, какие данные вам понадобятся для ее достижения? Хороший способ сделать это - работать в обратном направлении. Мы хотим предсказать намерение совершить покупку, поэтому будет очень полезно знать об исторических покупках. Также может быть полезно узнать, сколько товаров обычно покупают клиенты, как часто они совершают транзакции, покупают ли они во время продаж, после вознаграждения, до своего дня рождения. Наиболее логичные предикторы обычно наиболее информативны, но нет никаких гарантий, и выбор правильных данных (известный как выбор признаков) часто может быть больше искусством, чем наукой.

Сколько данных вам понадобится? К сожалению, нет четкого правила для объема данных, которые вам понадобятся, но в случае розничных тенденций вам понадобится исторические данные не менее 2 лет, чтобы иметь возможность включить сезонные тенденции в вашу модель.

Шаг 3 - Создайте модель, но начните с простого

Затем откройте выбранный вами инструмент моделирования. Если вы используете P ython, попробуйте S cikit-Learn, или для R нам нравится пакет Caret от Max Kuhn. Оба обладают способностью реализовывать большое разнообразие сложных алгоритмов машинного обучения, и, хотя это заманчиво, самое главное - начать с простой модели. Не потому, что они самые простые в установке и наиболее интерпретируемые, а потому, что вы можете быстро их изменить. Это очень важно при построении прогнозных моделей, потому что это итеративный процесс, и наибольший выигрыш можно получить быстро. Риск начать со сложной модели состоит в том, что у вас нет времени на ее улучшение, или, что еще хуже, сложная модель не лучше простой модели - и ее трудно интерпретировать.

Шаг 4 - Протестируйте свою модель

Поздравляем, теперь у вас есть модель, которая делает прогнозы. В нашем случае мы хотели знать, какие клиенты, скорее всего, совершат покупку в ближайшие 14 дней. Результатом нашей модели является просто добавление нового столбца или переменной к нашим данным с меткой Покупка или Нет покупки для каждого клиента в нашей базе данных. Сейчас важно практиковать хорошую гигиену данных. Убедитесь, что вы проверяете свои прогнозы на независимом наборе данных, который не использовался при обучении модели. В большинстве случаев это будет основано на выборке из удерживаемого набора данных, обычно 20%. Это даст вам наиболее надежную оценку того, как ваша модель будет работать в реальном мире.

Шаг 5. Установите (но не забывайте) свою модель

Чтобы использовать вашу модель, вам нужно дать ей место для работы. Вот ваши варианты развертывания:

  • Сохраняйте локальность. Самый простой способ - просто запустить модель на компьютере, на котором она была создана. Для этого требуется минимум работы по настройке.
  • Пакетная обработка: Настройте задание Cron или другой автоматизированный сервис для запуска модели каждый час / день / неделю и добавления прогнозов в вашу базу данных.
  • Пусть REST: создав RESTful API, любой в вашей организации может легко получить доступ к модели через HTTP и генерировать прогнозы в реальном времени.

Каким бы ни был ваш вариант развертывания, имейте в виду, что предсказательная модель хороша ровно настолько, насколько хороши данные, на которых она была построена. Это означает, что если вы просто оставите модель сидеть слишком долго, данные, на которых она была обучена, будут больше не содержать данных, обеспечивая все более худшие прогнозы. Всегда не забывайте обучать свои модели на самых последних данных, иначе они быстро потеряют свою ценность без вашего ведома.

Последнее слово

Прогнозное моделирование - это итеративный процесс. Выполните эти 5 шагов, и вы сможете быстро создавать прогнозы, но, чтобы выдержать испытание временем, часто пересматривайте свою модель.

Я Тим Пэрис, основатель Bold Voyage Data, консалтинговой компании по науке о данных, которая помогает компаниям принимать более разумные решения в отношении данных.