Что такое анализ причинно-следственных связей?
Анализ причинно-следственных связей – это методология, основанная на передовых технологиях машинного обучения и статистических концепциях, которая позволяет аналитику измерять постепенный эффект "изменения" во временном ряду. Теперь этот временной ряд может отражать отдачу от новой маркетинговой кампании, изменение характеристик продукта или сам поворот продукта.

Как это работает?
Предположим, вы являетесь менеджером по маркетингу компании, занимающейся потоковой передачей музыки, и в прошлом квартале вы запустили отличную кампанию по увеличению ежедневной базы активных пользователей вашего приложения для Android. Большой! Прошло 4 месяца, и ваш начальник просит вас показать, какую пользу эта кампания принесла компании.

Вот тут-то и появляется аналитик. Теперь, если он / она в курсе текущих тенденций маркетинговых измерений. Он/она обязательно проведет анализ причинно-следственных связей и сообщит вам, насколько сильно ваша кампания повлияла на базу активных пользователей.

Этапы

  • Будет собирать данные о ежедневных активных пользователях приложения для потоковой передачи музыки. Это будут данные временного ряда. И данные должны быть с прошлого года по настоящее время. (Чтобы было проще прямо сейчас)
  • Дата вмешательства должна быть определена. Именно тогда кампания заработала. Say Q2 1 апреля 2022 г.
  • Собранные данные должны быть разделены на две части ДО и ПОСЛЕ с использованием указанной выше Даты вмешательства.

  • Теперь данные временного ряда PRE должны использоваться для обучения модели и оценки «ПРОТИВОФАКТИЧЕСКОГО». То есть ежедневные активные пользователи в период POST, если не было маркетинговой кампании.
  • После того, как у нас есть предполагаемый контрфакт, все, что осталось сделать, это сравнить с ним наблюдаемый POST и проанализировать различия.

Заключение
Звучит не слишком сложно, верно? Это не так, но на самом деле это имеет много нюансов. Например, данные PRE должны быть надлежащей контрольной группой, иначе результаты не будут прямым представлением «Эффекта вмешательства». Или тот факт, что вам нужно подобрать модель временного ряда, которая хорошо отражает ваши данные.

Поэтому, чтобы упростить вашу работу, у нас есть готовый к использованию пакет PyCausalImpact в Python или CausalImpact в R. Он был разработан в Google и что он позволяет вам нужно больше сосредоточиться на анализе и меньше на подборе правильной статистической модели или кодировании и т. д.

(Для более глубокого понимания вы можете изучить документацию пакета или связаться со мной здесь)