Вопрос интервью по науке о данных в BLUE APRON (это набор предметов первой необходимости для еды, который компания работает по модели подписки)
Итак, прежде чем перейти к решению, давайте разберемся, как работает эта компания или какова точная бизнес-модель. Теперь вот первый совет: знание предметной области одинаково важно в машинном обучении, таком как алгоритмы, кодирование, математика. Без точного знания предметной области невозможно построить модель, способную решить проблему реального мира. Из знаний предметной области мы создаем функции, и это называется проектированием функций.
Итак, Blue Apron предоставляет набор сырых продуктов первой необходимости для любого приема пищи, скажем, я хочу есть здоровую пищу, но у меня нет времени, что они сделают?
- Они спросят меня, что я хочу иметь,
- Они сделают набор из всех основных продуктов питания, необходимых для этого блюда, и
- доставить как раз когда я приду из офиса.
Так что теперь я могу приготовить себе еду, просто готовя, мне не нужно ходить по магазинам, мне не нужно резать овощи и т. д., поэтому мне нужно 10 минут, чтобы поесть здоровую пищу. И вся эта модель работает на тему ежемесячной подписки.
Так что, если люди не возвращаются после использования в течение некоторого времени, это делает эту модель бизнесом, основанным на новинках, а не липким, давайте посмотрим, в чем может быть причина.
- Люди просто хотят попробовать в течение 1-2 месяцев, а затем прекращают.
- Людям надоедает одно и то же меню.
- Вполне возможно, что пары могли выбрать его, когда в офисе напряженный график, попробовать его в течение нескольких недель, и когда все нормализуется, они вернулись к нормальной жизни.
- Ожидание продукта не соответствует действительности.
- Плохая поддержка клиентов.
Никакая гипотеза не будет очень простой, скажем, люди используют ее всего 2 месяца, поэтому для проверки просмотрите данные и проверьте время жизни клиента в Blue Apron и найдите процентили.
Допустим, мы получили 70% клиентов, оставивших подписку в течение 2 месяцев, только 30% используют ее после слов, мы проверим гипотезу:
- Прежде чем клиент завершит подписку, попросите его заполнить форму, в которой будет указана причина ухода.
- Примените набор слов, облако слов, методы tf_idf и посмотрите, какие слова наиболее часто используются клиентами, и постройте ГРАФИК ОБЛАКА СЛОВ.
3. Передайте этот отчет высшему руководству для работы над факторами, обнаруженными в приведенных выше пунктах.