… И как их узнать

Если вы когда-либо искали работу в области науки о данных, вы, вероятно, заметили, что почти на всех вакансиях требуется, чтобы кто-то с предыдущим опытом действительно работал специалистом по данным.

В результате новичкам сложно выйти на поле и фактически получить свою первую работу.

Причина, по которой большинству компаний нужен опытный специалист по анализу данных, а не новый квалифицированный кандидат, заключается в том, что существует ряд чрезвычайно жизненно важных навыков, необходимых для предоставления решений в области науки о данных в бизнес-среде, которая используется в большинстве курсов по науке о данных, учебных лагерей и программ на получение степени. не учу тебя.

В этом посте я расскажу о трех жизненно важных навыках, необходимых для создания ценности для бизнеса с помощью науки о данных, и о том, как вы можете их приобрести.

1. Программная инженерия

Несколько лет назад при просмотре объявлений о вакансиях для специалистов по анализу данных набор навыков обычно был в значительной степени ориентирован на наличие знаний в области математики и / или статистики. Докторантура или, как минимум, степень магистра обычно указывались в качестве требования.

В наши дни требуемые навыки сместились в сторону навыков программирования и разработки программного обеспечения, таких как знание Python, Github и SQL. Сейчас довольно редко можно увидеть степень доктора философии, указанную в качестве важного требования в объявлении о вакансии в области науки о данных.

Причины этого во многом двоякие:

  • Компании осознали это независимо от качества модели или уровня сложности процессов, используемых для ее разработки. Если вы не можете развернуть модель в операционной части бизнеса, такой как веб-сайт, то модель фактически бесполезна.
  • В то же время пакеты, платформы и инструменты машинного обучения стали более доступными, а барьер для внедрения этих инструментов значительно снизился. Это, наряду с растущей доступностью инструментов autoML, означает, что вам больше не нужно иметь глубокие теоретические знания методов машинного обучения для разработки моделей. Теперь задача состоит в том, чтобы внедрить эти модели в производственную среду и подключить их к интерфейсной системе.

Сегодня ожидается, что специалисты по обработке данных смогут писать код производственного качества, чтобы они могли развертывать модели независимо от других команд, или, по крайней мере, чтобы разработчики программного обеспечения, развертывающие модели, могли хорошо читать, использовать и интерпретировать код. .

Итак, как вы можете приобрести эти навыки разработки программного обеспечения:

  • Пройдите несколько курсов по разработке программного обеспечения / читайте книги вместе с курсами по науке о данных. На прошлой неделе я опубликовал список из 5 моих любимых книг по программированию на Python, которые действительно хорошо охватывают общие передовые практики программирования.
  • Создайте практический побочный проект, охватывающий весь процесс разработки модели - от согласования данных до разработки модели и ее развертывания. Убедитесь, что ваш код хорошо структурирован, включает тесты и придерживается общих рекомендаций по разработке программного обеспечения.
  • Участвуйте в проектах с открытым исходным кодом (или прочтите инструкции по участию и внедрите их в свои собственные проекты). Пакеты с открытым исходным кодом должны соответствовать строгим методам разработки программного обеспечения, чтобы несколько человек могли безопасно поддерживать и добавлять в один и тот же проект. Участие в этих проектах (часто проводятся хакатоны для поддержки новичков) может помочь вам получить реальный опыт разработки программного обеспечения. В качестве альтернативы можно прочитать документацию по некоторым библиотекам - Scikit-learn отлично подходят, могут помочь вам понять, как эти методы используются на практике.

2. Связь

Я вижу, что в последнее время все чаще и чаще используется фраза о том, что «наука о данных - это не продукт». Это означает, что модель машинного обучения, которую создают специалисты по данным, не является конечным продуктом. Ценность модели машинного обучения заключается в ее развертывании в существующей бизнес-системе или продукте, который решает бизнес-проблему.

наука о данных - это не продукт

Этот процесс от сбора данных до модели, используемой в продукте, не может выполняться специалистами по данным в одиночку. Специалистам по данным необходимо работать с:

  • Заинтересованные стороны проекта, такие как менеджеры по продуктам и директора, должны преобразовать свою бизнес-проблему в проблему с данными, а затем передать им решение данных таким образом, чтобы это было понятно для нетехнического специалиста.
  • Инженеры по данным, которые будут следить за тем, чтобы данные, необходимые специалисту по данным для построения модели, были точно собраны, преобразованы и предоставлены в нужном месте.
  • Разработчики программного обеспечения, которые подключат существующую систему или продукт к модели машинного обучения. Специалист по анализу данных должен убедиться, что он четко сообщает, какие данные необходимо вводить в модель, а также о любых ограничениях и сетях безопасности, которые должны быть на месте.

Поэтому специалисты по данным должны быть отличными коммуникаторами, поскольку в проекте так много всего поставлено на карту, если правильная информация не передается или не интерпретируется в нужное время и правильным образом.

Чтобы развить коммуникативные навыки, нужна практика. Если вы изучаете науку о данных, есть много возможностей попрактиковать эти навыки и в то же время улучшить процесс обучения. Поскольку объяснение новых концепций, которым вы научились кому-то, является одним из наиболее признанных методов обучения, известных как Техника Фейнмана.

«Если вы хотите что-то хорошо изучить, объясните это!», Ричард Фейнман

Есть несколько способов отточить коммуникативные навыки в процессе обучения:

  • Предложите наставнику или наставнику других, которые находятся на более ранних этапах своего пути обучения, чем вы.
  • Найдите возможность рассказать о том, что вы узнали. Даже с учетом текущих ограничений на проведение больших собраний в большинстве стран, проводится множество онлайн-конференций и встреч.
  • Пишите учебные пособия, сообщения в блогах, обзоры книг или описания проектов. Вы можете разместить их на своем собственном веб-сайте или написать здесь, на Medium.

3. Деловая хватка

Вы часто будете видеть знания предметной области, перечисленные как навыки, необходимые специалистам по анализу данных. Реальность такова, что наука о данных может применяться во многих различных областях, поэтому сложно получить знания до того, как начать работу в этой конкретной области.

Однако один навык, который можно отточить, - это деловая хватка.

За последние несколько лет в области науки о данных наблюдался рост числа гражданских специалистов по данным. Не специалист по данным, работающий в определенной области бизнеса и использующий новые, более доступные инструменты анализа данных для применения науки о данных для решения проблем в своей области.

Причина роста популярности гражданских специалистов по данным заключается в том, что кто-то работает в определенной области, например, отдел маркетинга лучше всех осведомлен о существующих проблемах, которые созрели для решения с помощью машинного обучения.

«Мир - это одна большая проблема данных», - Эндрю Макафи.

Поэтому важно, чтобы специалист по обработке данных хорошо разбирался в бизнес-процессах и основах ведения бизнеса, поскольку это гарантирует, что они смогут приносить пользу и решать бизнес-проблемы с помощью данных.

Итак, как получить эти бизнес-знания:

  • Стремитесь хотя бы немного узнать о сферах бизнеса, особенно в цифровом пространстве, с помощью статей или коротких курсов. Например, неплохо было бы узнать что-нибудь о современном цифровом маркетинге (PPC, электронная почта, медийная реклама и SEO), а также о существующих проблемах и потенциальных возможностях оптимизации.
  • Если вы в настоящее время работаете в бизнесе, попробуйте проводить время в других областях и время от времени сидеть с другими командами, чтобы понять их конкретную область. Если вы не работаете в бизнесе, создайте собственные возможности для практического изучения бизнес-процессов. Например, я регулярно отправляю информационный бюллетень по электронной почте, и это помогло мне немного узнать о проблемах, существующих в электронном маркетинге.

Можно изучить теорию и практические элементы науки о данных с помощью онлайн-курса, учебных лагерей и программ на получение степени. Однако существует существенная разница между разработкой проектов и моделей в образовательной среде по сравнению с разработкой проектов по науке о данных для решения реальных бизнес-задач. Дополнительные навыки, перечисленные в этой статье, помогут вам понять некоторые из этих проблем и приобрести навыки, которые понадобятся вам, чтобы стать действительно полезным специалистом по данным.

Спасибо за прочтение!

Я отправляю ежемесячный информационный бюллетень, если вы хотите присоединиться, зарегистрируйтесь по этой ссылке. С нетерпением жду возможности принять участие в вашем образовательном путешествии!