Как можно предвидеть, планировать и смягчать

Менеджер по продукту данных стал новой ролью, которая следует за быстро растущей потребностью в специалистах по обработке данных. По мере того, как компании начинают осознавать уникальные проблемы создания и управления группами обработки данных, они нанимают менеджеров по продуктам, ориентированных на данные, для принятия уникальных стратегических и тактических решений, связанных с созданием новых продуктов для обработки данных.

Эти новоиспеченные менеджеры по продуктам данных сталкиваются с уникальными проблемами. Как компании могут правильно предвидеть, планировать и преодолевать эти проблемы? Если вы являетесь менеджером по продукту данных или хотите им стать - каких проблем вы можете ожидать?

Обязанности менеджера по информационным продуктам во многом такие же, как и у любого менеджера по программному продукту. 90% повседневных обязанностей по-прежнему будут заключаться в установлении приоритетов, коммуникациях, управлении заинтересованными сторонами, сотрудничестве при проектировании и создании спецификаций. От вас по-прежнему ожидается создание бизнес-кейсов, управление невыполненными работами, представление планов выпуска и взаимодействие с внутренними и внешними заинтересованными сторонами. По сути, вы по-прежнему несете ответственность за правильную приоритизацию инвестиций в НИОКР в краткосрочной и долгосрочной перспективе для оптимизации бизнес-результатов.

Задача связана с дополнительной работой не только по расстановке приоритетов и определению решений, ориентированных на рабочий процесс, но и решений на основе данных. Предоставление решений на основе данных требует долгосрочного планирования и зачастую более капиталоемких инвестиций. Процессы также меняются с более сложными циклами разработки и изменениями в текущем обслуживании.

Экономическое обоснование опционов

Если вы строите функции на уже существующем продукте или на новом продукте в целом, выбор проблемы с наивысшим приоритетом для решения остается вашим наивысшим приоритетом. Заголовок «менеджер по продукту данных» может побудить вас выбрать способ доставки вашей функции - науку о данных или аналитику в некотором роде. Как PM, вам нужно противостоять побуждению бросить решение данных для всех инвестиционных проблем. Ваши инвесторы будут благодарить вас за разумный выбор данных и рабочих процессов.

Итак, как вы разрабатываете свое решение - рабочий процесс, управляемый только данными?

  • Является ли ценность решения для обработки данных уникальной и ценной информацией? Или существует ли ценность в эффективности рабочего процесса?
  • Возможны ли финансовые затраты на сбор данных и / или маркировку данных в рамках вашего бизнес-сценария? Не стоит недооценивать эту стоимость - многие проекты требуют вливания свежего капитала только для создания маркированных данных обучения.
  • Есть ли у вас хорошие возможности для того, чтобы опередить конкурентов, обладая информационными ресурсами, видением и талантом?

Если ответ на любой из этих вопросов приводит вас к чувству «нет» или «звучит так, как будто я должен просто выполнить функцию рабочего процесса», значит, у вас есть ответ, и вам нужно сначала поработать над решением этих проблем. Допустим, вы говорите: «Да! Давайте займемся наукой о данных », и тогда есть еще несколько вещей, которых следует ожидать.

Более сложные циклы разработки

Ваши циклы разработки скоро изменятся. Они будут становиться длиннее и сложнее по мере добавления ресурсов и уникальных процессов, связанных с развитием науки о данных. Команды по анализу данных занимаются сбором / поиском данных, обнаружением, очисткой / обработкой, обучением, а иногда и развертыванием. Ваша первоначальная интеграция этих новых специалистов по обработке данных и существующих групп разработчиков чрезвычайно важна. Многие специалисты по обработке данных и руководители с новыми командами по обработке данных шокированы временем, потраченным на первые три шага данных - сбор, обнаружение и очистку. Более 90% времени специалиста по данным тратится на эти задачи, а не на создание, тестирование и развертывание моделей. Так что же делать?

Если вам нужны специалисты по данным, наймите аналитиков и предоставьте им инструменты, которые они попросят, например Alteryx, DataRobot или Knime. Хорошие аналитики данных могут использовать эти решения для экспериментов с созданием каналов данных, обнаружением, очисткой и тестированием общих моделей. Эта ранняя работа ваших аналитиков может значительно ускорить время построения и стать экономичным решением, на которое специалисты по данным в противном случае потратили бы уйму времени до создания и тестирования модели.

Текущее обслуживание

Планируйте практически немедленную деградацию модели и, следовательно, более высокие, чем обычно, текущие расходы на техническое обслуживание. Модель машинного обучения развивается в зависимости от мира, которого она касается - ее необходимо поддерживать, чтобы она была в идеальном состоянии. Как и в случае с новыми функциями для проектов, не связанных с данными, вам потребуется более дорогое, чем обычно, предварительное обслуживание и долгий срок для текущего. Если вам нужно вручную пометить данные обучения или выполнить процесс сбора вручную, не забывайте, что это тоже будет частью обслуживания, так как вам, вероятно, придется обновить свои модели этой новой информацией.

Разобраться в сложностях науки о данных

Если у вас нет опыта в области науки о данных - ничего страшного. Моя главная рекомендация - погрузиться в мир науки о данных, пусть даже ненадолго. Это даст вам контекст и лучшее понимание проблем, с которыми столкнется ваша группа данных. Я рекомендую несколько путей:

  • Возьмите MOOC - сначала освежите свою статистику, прежде чем погрузиться в машинное обучение.
  • Если у вас нет опыта разработки программного обеспечения - используйте инструменты, которые помогут вам ускорить обучение - Alteryx, Knime, RapidMiner и DataRobot - отличные инструменты по разной цене (Knime предлагает наиболее удобные бесплатные вариант).
  • Проведите соревнование Kaggle или DrivenData, используя один из вышеперечисленных инструментов. Это может занять всего 2 часа, и это отличный способ учиться на практике. Если вы хотите убедиться в силе глубокого обучения в одном из этих соревнований - попробуйте использовать AI-решение H2O без водителя, это невероятно.

Мысли о дополнительных задачах менеджера по информационным продуктам? Дайте мне знать! Нужна помощь с проектом данных, о котором вы думали? Твитнуть или написать мне в Linkedin. Ваше здоровье!