Вопрос интервью по науке о данных в BLUE APRON (это набор предметов первой необходимости для еды, который компания работает по модели подписки)

Итак, прежде чем перейти к решению, давайте разберемся, как работает эта компания или какова точная бизнес-модель. Теперь вот первый совет: знание предметной области одинаково важно в машинном обучении, таком как алгоритмы, кодирование, математика. Без точного знания предметной области невозможно построить модель, способную решить проблему реального мира. Из знаний предметной области мы создаем функции, и это называется проектированием функций.

Итак, Blue Apron предоставляет набор сырых продуктов первой необходимости для любого приема пищи, скажем, я хочу есть здоровую пищу, но у меня нет времени, что они сделают?

  • Они спросят меня, что я хочу иметь,
  • Они сделают набор из всех основных продуктов питания, необходимых для этого блюда, и
  • доставить как раз когда я приду из офиса.

Так что теперь я могу приготовить себе еду, просто готовя, мне не нужно ходить по магазинам, мне не нужно резать овощи и т. д., поэтому мне нужно 10 минут, чтобы поесть здоровую пищу. И вся эта модель работает на тему ежемесячной подписки.

Так что, если люди не возвращаются после использования в течение некоторого времени, это делает эту модель бизнесом, основанным на новинках, а не липким, давайте посмотрим, в чем может быть причина.

  1. Люди просто хотят попробовать в течение 1-2 месяцев, а затем прекращают.
  2. Людям надоедает одно и то же меню.
  3. Вполне возможно, что пары могли выбрать его, когда в офисе напряженный график, попробовать его в течение нескольких недель, и когда все нормализуется, они вернулись к нормальной жизни.
  4. Ожидание продукта не соответствует действительности.
  5. Плохая поддержка клиентов.

Никакая гипотеза не будет очень простой, скажем, люди используют ее всего 2 месяца, поэтому для проверки просмотрите данные и проверьте время жизни клиента в Blue Apron и найдите процентили.

Допустим, мы получили 70% клиентов, оставивших подписку в течение 2 месяцев, только 30% используют ее после слов, мы проверим гипотезу:

  1. Прежде чем клиент завершит подписку, попросите его заполнить форму, в которой будет указана причина ухода.
  2. Примените набор слов, облако слов, методы tf_idf и посмотрите, какие слова наиболее часто используются клиентами, и постройте ГРАФИК ОБЛАКА СЛОВ.

3. Передайте этот отчет высшему руководству для работы над факторами, обнаруженными в приведенных выше пунктах.

Спасибо за чтение, наслаждайтесь машинным обучением…