Итак, вы хотите быть менеджером по продукту в области науки о данных?

Начинающие продакт-менеджеры (PM) рано или поздно захотят сменить профессию и перейти в область данных. Однако существует пробел в знаниях и опыте, который необходимо восполнить. PM, проходящий переходный период, должен изучить множество новых тем машинного обучения (ML), хотя их можно практиковать, в основном ожидается их теоретическое понимание и понимание их последствий.

В следующей статье делается попытка перечислить как можно больше базовых навыков, необходимых для роли менеджера по продуктам обработки данных (DSPM). Пожалуйста, имейте в виду, что большинство из них применимы к любой роли менеджера по продуктам данных. Этот список не является исчерпывающим, но он охватывает множество знаний и навыков, которые имеют основополагающее значение для этой роли. Кроме того, хотя эта статья может быть интерпретирована как для продакт-менеджеров, так и для менеджеров по найму, с точки зрения того, какие навыки необходимы от продакт-менеджера данных, она в первую очередь предназначена для продакт-менеджеров.

Я разделил эту статью на три основные темы: 1. Данные, 2. Основы машинного обучения, 3. Продукт данных. Мы начинаем с данных, потому что это основа для всего, понимание данных и того, как с ними обращаться, является основой для всего, что мы хотим и должны делать. Как только мы узнаем, как работать с данными, мы переходим к основам машинного обучения, которые строятся на их основе, как на практике, так и в теории. ML — это абстракция более высокого уровня решения проблем с использованием данных, поэтому он занимает второе место в списке. Наконец, мы подключаемся как к домену продукта данных, по сути, упаковывая данные и машинное обучение как ценность, предоставляемую клиенту.

Данные

Список навыков в этом разделе необходим для овладения данными с точки зрения понимания концепций данных и их применения. Другими словами, продакт-менеджер данных должен уметь думать и делать следующее.

  1. Понимать и думать с точки зрения данных. т. е. сколько данных необходимо, какие данные нужны и зачем они нам нужны? как мы это получим? откуда мы это берем? как мы это отследим? и как мы его используем?
  2. Знать SQL и pandas, чтобы самостоятельно выполнять простой анализ данных. Независимость от понимания данных является ключевым фактором для менеджера по управлению данными.
  3. Чтобы связать имеющиеся данные с возможностью решения проблемы, например, понять, достаточно ли данных у организации для решения бизнес-проблемы.
  4. Чтобы понять зависимости между процессами обработки данных, чтобы создать ценность для бизнеса.
  5. Чтобы понять пробелы в данных и заполнить их, чтобы решить будущие проблемы. Это происходит из-за сосредоточенности и доступных ресурсов.
  6. Предложить внешние источники данных, например, если есть необходимость увеличить или улучшить возможности извлечения информации.

Например, возникла потребность бизнеса в обнаружении парковочных мест на видео. Прежде чем использовать ценные ресурсы DS для решения проблемы, следует быстро проверить, достаточно ли в организации видеоматериалов улиц, на которых достаточно места для парковки, пустых или заполненных. Если нет, следует определить и спланировать получение достаточного количества видеоматериалов, учитывая рентабельность инвестиций на этом этапе предварительной разработки.

Основы машинного обучения

Как только важность и понимание методов обработки данных как бизнес-инструмента укрепятся, мы сможем перейти к пониманию тем, процессов, инструментов, методов и т. д. машинного обучения. Машинное обучение — это абстракция данных более высокого уровня. На самом базовом уровне мы следуем процессам и практикам научных исследований, используем модели машинного обучения для понимания данных, запрашиваем модели машинного обучения, чтобы понять процессы принятия решений в их «черных ящиках» и т. д. Другими словами, DSPM должен уметь мыслить как данные. ученый. Обратите внимание: я твердо верю, что специалист по обработке и анализу данных также должен понимать современное управление продуктами, это работает в обоих направлениях.



  1. Чтобы понять общие алгоритмы машинного обучения и их возможности, т. е. что вы можете ожидать и не ожидать.
  2. Настаивать на создании более простых решений, предлагая их.
  3. Чтобы понять различия между классификацией, регрессией, кластеризацией, обучением с подкреплением, активным обучением и т. д.
  4. Чтобы понять такие показатели, как точность, полнота, точность, F1, MAE, AUC и PRAUC, и то, как они служат бизнес-потребностям.
  5. Чтобы понять компромиссы между метриками, например, между точностью и ориентацией на отзыв, в контексте решения проблем, т. е. хотите ли вы решение, ориентированное на точность или ориентированное на отзыв?
  6. Преодоление разрыва между показателями DS, решениями и ключевыми показателями эффективности бизнеса.
  7. Чтобы понять компромиссы между решением общей задачи и конкретной, то есть, когда мы должны подходить к каждой из них с точки зрения данных и алгоритмической стратегии?
  8. Чтобы понять общие области бизнеса ML.
  9. Понимать процессы сбора данных.
  10. Понимать процессы генерации данных.
  11. Понимать процессы маркировки данных.
  12. Чтобы понять жизненный цикл исследования машинного обучения, т. е. что значит исследовать новую проблему? с точки зрения охвата, времени и оценок.
  13. Чтобы понять жизненный цикл производства машинного обучения.
  14. Чтобы понять разницу между обучением, тестированием и валидацией.
  15. Чтобы понять валидацию решения.
  16. Понимать стратегии тренировок.
  17. Знать инструменты жизненного цикла машинного обучения, такие как управление экспериментами, хранилища функций и хранилища моделей.
  18. Чтобы понять наблюдаемость ML.
  19. Понимать архитектуру данных (продвинутый уровень).

Принимая во внимание ту же потребность бизнеса в обнаружении мест для парковки на видео, PM должен провести исследование и проконсультироваться с DS, чтобы понять, является ли бизнес-потребность обнаружением или классификацией объектов, и хотим ли мы быть более точным в решении по сравнению с наличием высокий отзыв. Чтобы понять, нужен ли новый процесс обработки данных с точки зрения приема, хранения, обработки и т. д. Чтобы понять примерное время выхода на рынок, рентабельность инвестиций, потребуется ли команде получить бюджет для маркировки видео и, в конечном итоге, составить план с все необходимые этапы.

Продукт данных

Когда у нас будет достаточно знаний в предыдущих областях, нам нужно связать данные и машинное обучение с потребностями бизнеса и с продуктом. Например, как использовать решения бизнес-проблем в качестве продукта, ориентированного на клиента. Другими словами, DSPM должен иметь четкое видение и продуманный план продукта, который начинается со следующих навыков.



  1. Понять, что алгоритм — это не продукт.
  2. Провести исследование конкурентного рынка в контексте необходимой функциональности машинного обучения.
  3. Быть изобретательным с точки зрения вариантов использования, используя одно решение проблемы для нескольких вариантов использования.
  4. Взять очень сложные идеи и упростить их. Решения машинного обучения сложны и не так доступны, как другие идеи.
  5. Представить и визуализировать модель как функцию продукта, чтобы понять различные сложности между взаимодействием с клиентом и тем, что может дать модель.
  6. Чтобы понять потребности и боли конечных пользователей в контексте решения проблем ML и провести мозговой штурм с учеными данных.
  7. Чтобы понять, когда наступает подходящий момент, чтобы сойтись с этапом исследования и начать производство.
  8. Превратить креативность продукта в аналитический слой поверх процессов, экранов и систем. Другими словами, поработать с экспертами по UI/UX, чтобы понять, как правильно показывать информацию о машинном обучении пользователю.
  9. Понимание крайних случаев и того, что выходит за рамки исследований продукта и машинного обучения, которые не нужно проводить.
  10. Убедиться в наличии документации по этой функции, а также в том, что технология и ее ограничения точно доведены до сведения пользователя и заинтересованных сторон, которые поддерживают клиентов и продажи.
  11. Чтобы оставаться на связи с пользователями и проводить проверку пользователей на основе данных.

Работа с той же проблемой парковки. PM должен провести конкурентное исследование рынка. Посмотрите, кто работал над этой проблемой, и каковы были их подходы. Они также должны выяснить, кто в настоящее время разрабатывает решение этой проблемы и насколько оно проработано; и если есть доступные Kaggle или проекты с открытым исходным кодом. Они должны поставить себя на место пользователей и определить, что необходимо для решения их болевых точек. Они должны создать видение и визуальные экраны, которые увидит клиент, и соединить точки между тем, что возможно с точки зрения технологии ML, с учетом текущего состояния данных и возможностей в компании, с продуктовым решением. Они должны проверять проекты машинного обучения перед началом разработки из-за дорогостоящего характера проектов машинного обучения и принимать меры после того, как предварительная версия продукта будет запущена и запущена.

Краткое содержание

Я надеюсь, что эта статья позволит менеджерам по продуктам понять объем знаний и обширный набор навыков, необходимых для перехода на должность менеджера по продуктам данных.

Я хотел бы поблагодарить Simon Reisman, Dor Sasson, Inbal Budowski-Tal, Eran Paz, Lev Dun и Oded Lipnik, которые предоставили неоценимые отзывы для этой статьи.

Доктор Ори Коэн имеет докторскую степень. в области компьютерных наук с упором на машинное обучение. Он является автором Компендиума ML & DL и StateOfMLOPs.com. В настоящее время он является старшим директором по данным в Justt.ai.