Итак, вы хотите быть менеджером по продукту в области науки о данных?
Начинающие продакт-менеджеры (PM) рано или поздно захотят сменить профессию и перейти в область данных. Однако существует пробел в знаниях и опыте, который необходимо восполнить. PM, проходящий переходный период, должен изучить множество новых тем машинного обучения (ML), хотя их можно практиковать, в основном ожидается их теоретическое понимание и понимание их последствий.
В следующей статье делается попытка перечислить как можно больше базовых навыков, необходимых для роли менеджера по продуктам обработки данных (DSPM). Пожалуйста, имейте в виду, что большинство из них применимы к любой роли менеджера по продуктам данных. Этот список не является исчерпывающим, но он охватывает множество знаний и навыков, которые имеют основополагающее значение для этой роли. Кроме того, хотя эта статья может быть интерпретирована как для продакт-менеджеров, так и для менеджеров по найму, с точки зрения того, какие навыки необходимы от продакт-менеджера данных, она в первую очередь предназначена для продакт-менеджеров.
Я разделил эту статью на три основные темы: 1. Данные, 2. Основы машинного обучения, 3. Продукт данных. Мы начинаем с данных, потому что это основа для всего, понимание данных и того, как с ними обращаться, является основой для всего, что мы хотим и должны делать. Как только мы узнаем, как работать с данными, мы переходим к основам машинного обучения, которые строятся на их основе, как на практике, так и в теории. ML — это абстракция более высокого уровня решения проблем с использованием данных, поэтому он занимает второе место в списке. Наконец, мы подключаемся как к домену продукта данных, по сути, упаковывая данные и машинное обучение как ценность, предоставляемую клиенту.
Данные
Список навыков в этом разделе необходим для овладения данными с точки зрения понимания концепций данных и их применения. Другими словами, продакт-менеджер данных должен уметь думать и делать следующее.
- Понимать и думать с точки зрения данных. т. е. сколько данных необходимо, какие данные нужны и зачем они нам нужны? как мы это получим? откуда мы это берем? как мы это отследим? и как мы его используем?
- Знать SQL и pandas, чтобы самостоятельно выполнять простой анализ данных. Независимость от понимания данных является ключевым фактором для менеджера по управлению данными.
- Чтобы связать имеющиеся данные с возможностью решения проблемы, например, понять, достаточно ли данных у организации для решения бизнес-проблемы.
- Чтобы понять зависимости между процессами обработки данных, чтобы создать ценность для бизнеса.
- Чтобы понять пробелы в данных и заполнить их, чтобы решить будущие проблемы. Это происходит из-за сосредоточенности и доступных ресурсов.
- Предложить внешние источники данных, например, если есть необходимость увеличить или улучшить возможности извлечения информации.
Например, возникла потребность бизнеса в обнаружении парковочных мест на видео. Прежде чем использовать ценные ресурсы DS для решения проблемы, следует быстро проверить, достаточно ли в организации видеоматериалов улиц, на которых достаточно места для парковки, пустых или заполненных. Если нет, следует определить и спланировать получение достаточного количества видеоматериалов, учитывая рентабельность инвестиций на этом этапе предварительной разработки.
Основы машинного обучения
Как только важность и понимание методов обработки данных как бизнес-инструмента укрепятся, мы сможем перейти к пониманию тем, процессов, инструментов, методов и т. д. машинного обучения. Машинное обучение — это абстракция данных более высокого уровня. На самом базовом уровне мы следуем процессам и практикам научных исследований, используем модели машинного обучения для понимания данных, запрашиваем модели машинного обучения, чтобы понять процессы принятия решений в их «черных ящиках» и т. д. Другими словами, DSPM должен уметь мыслить как данные. ученый. Обратите внимание: я твердо верю, что специалист по обработке и анализу данных также должен понимать современное управление продуктами, это работает в обоих направлениях.
- Чтобы понять общие алгоритмы машинного обучения и их возможности, т. е. что вы можете ожидать и не ожидать.
- Настаивать на создании более простых решений, предлагая их.
- Чтобы понять различия между классификацией, регрессией, кластеризацией, обучением с подкреплением, активным обучением и т. д.
- Чтобы понять такие показатели, как точность, полнота, точность, F1, MAE, AUC и PRAUC, и то, как они служат бизнес-потребностям.
- Чтобы понять компромиссы между метриками, например, между точностью и ориентацией на отзыв, в контексте решения проблем, т. е. хотите ли вы решение, ориентированное на точность или ориентированное на отзыв?
- Преодоление разрыва между показателями DS, решениями и ключевыми показателями эффективности бизнеса.
- Чтобы понять компромиссы между решением общей задачи и конкретной, то есть, когда мы должны подходить к каждой из них с точки зрения данных и алгоритмической стратегии?
- Чтобы понять общие области бизнеса ML.
- Понимать процессы сбора данных.
- Понимать процессы генерации данных.
- Понимать процессы маркировки данных.
- Чтобы понять жизненный цикл исследования машинного обучения, т. е. что значит исследовать новую проблему? с точки зрения охвата, времени и оценок.
- Чтобы понять жизненный цикл производства машинного обучения.
- Чтобы понять разницу между обучением, тестированием и валидацией.
- Чтобы понять валидацию решения.
- Понимать стратегии тренировок.
- Знать инструменты жизненного цикла машинного обучения, такие как управление экспериментами, хранилища функций и хранилища моделей.
- Чтобы понять наблюдаемость ML.
- Понимать архитектуру данных (продвинутый уровень).
Принимая во внимание ту же потребность бизнеса в обнаружении мест для парковки на видео, PM должен провести исследование и проконсультироваться с DS, чтобы понять, является ли бизнес-потребность обнаружением или классификацией объектов, и хотим ли мы быть более точным в решении по сравнению с наличием высокий отзыв. Чтобы понять, нужен ли новый процесс обработки данных с точки зрения приема, хранения, обработки и т. д. Чтобы понять примерное время выхода на рынок, рентабельность инвестиций, потребуется ли команде получить бюджет для маркировки видео и, в конечном итоге, составить план с все необходимые этапы.
Продукт данных
Когда у нас будет достаточно знаний в предыдущих областях, нам нужно связать данные и машинное обучение с потребностями бизнеса и с продуктом. Например, как использовать решения бизнес-проблем в качестве продукта, ориентированного на клиента. Другими словами, DSPM должен иметь четкое видение и продуманный план продукта, который начинается со следующих навыков.
- Понять, что алгоритм — это не продукт.
- Провести исследование конкурентного рынка в контексте необходимой функциональности машинного обучения.
- Быть изобретательным с точки зрения вариантов использования, используя одно решение проблемы для нескольких вариантов использования.
- Взять очень сложные идеи и упростить их. Решения машинного обучения сложны и не так доступны, как другие идеи.
- Представить и визуализировать модель как функцию продукта, чтобы понять различные сложности между взаимодействием с клиентом и тем, что может дать модель.
- Чтобы понять потребности и боли конечных пользователей в контексте решения проблем ML и провести мозговой штурм с учеными данных.
- Чтобы понять, когда наступает подходящий момент, чтобы сойтись с этапом исследования и начать производство.
- Превратить креативность продукта в аналитический слой поверх процессов, экранов и систем. Другими словами, поработать с экспертами по UI/UX, чтобы понять, как правильно показывать информацию о машинном обучении пользователю.
- Понимание крайних случаев и того, что выходит за рамки исследований продукта и машинного обучения, которые не нужно проводить.
- Убедиться в наличии документации по этой функции, а также в том, что технология и ее ограничения точно доведены до сведения пользователя и заинтересованных сторон, которые поддерживают клиентов и продажи.
- Чтобы оставаться на связи с пользователями и проводить проверку пользователей на основе данных.
Работа с той же проблемой парковки. PM должен провести конкурентное исследование рынка. Посмотрите, кто работал над этой проблемой, и каковы были их подходы. Они также должны выяснить, кто в настоящее время разрабатывает решение этой проблемы и насколько оно проработано; и если есть доступные Kaggle или проекты с открытым исходным кодом. Они должны поставить себя на место пользователей и определить, что необходимо для решения их болевых точек. Они должны создать видение и визуальные экраны, которые увидит клиент, и соединить точки между тем, что возможно с точки зрения технологии ML, с учетом текущего состояния данных и возможностей в компании, с продуктовым решением. Они должны проверять проекты машинного обучения перед началом разработки из-за дорогостоящего характера проектов машинного обучения и принимать меры после того, как предварительная версия продукта будет запущена и запущена.
Краткое содержание
Я надеюсь, что эта статья позволит менеджерам по продуктам понять объем знаний и обширный набор навыков, необходимых для перехода на должность менеджера по продуктам данных.
Я хотел бы поблагодарить Simon Reisman, Dor Sasson, Inbal Budowski-Tal, Eran Paz, Lev Dun и Oded Lipnik, которые предоставили неоценимые отзывы для этой статьи.
Доктор Ори Коэн имеет докторскую степень. в области компьютерных наук с упором на машинное обучение. Он является автором Компендиума ML & DL и StateOfMLOPs.com. В настоящее время он является старшим директором по данным в Justt.ai.