Прочитав это, вы получите более глубокое понимание облачных сертификатов и DP-100.

0.a) Стоит ли эта сертификация?

Прежде чем вы начнете судить меня и беспокоиться о том, что я могу страдать от «синдрома предвзятости подтверждения» (я сдал экзамен и сдал его, так что у меня может возникнуть соблазн найти каждый аргумент, чтобы сказать, что это лучший сертификат на свете), я хочу вам сказать, что в этом нет необходимости!

Здесь не встретишь высказываний типа «учись, стань лучшим, как я!» или «Это было невероятно сложно, пройдёт только опытный специалист по данным». То, что вы собираетесь прочитать, будет попыткой задать правильные вопросы о том, какие облачные сертификаты в области науки о данных могут означать для вас и для отрасли в целом.

В случае, если вы решаете, хотите вы это прочитать или нет, я заранее опишу вам место, где будет опубликовано это сообщение в блоге: это будет о ВАС, а не обо мне.

Я искренне верю, что проблема, которую нам нужно решить, прежде чем вы примете это решение, больше связана с тем, что «это подходит МЕНЯ?» вопрос, чем "это ХОРОШИЙ или ПЛОХОЙ значок для заработка?" (как обычно, реальность сложнее, чем просто добро или зло, не так ли?).

0.b) Что это все значит?

Что ж, если вас заинтриговало это претенциозное введение, позвольте мне рассказать вам, КАК мы постараемся ответить, является ли эта сертификация хорошим шагом для вас или нет. Здесь вы можете увидеть графическое изображение нашей повестки дня:

Независимо от того, нравится нам это или нет, мы не можем отрицать, что являемся частью экосистемы, и эта экосистема имеет свои собственные тенденции и явления, на которые мы должны обратить внимание. Если мы избегаем этой части, мы можем не справиться с проблемой.

В первой части мы опишем контекст науки о данных и то, что на самом деле происходит в отрасли. Знание того, что происходит вокруг нас, даст нам возможность понять, являются ли сертификаты ценными или могут быть ценными в ближайшем будущем.

Кроме того, как вы, возможно, знаете, чтобы узнать, подходит ли что-то вам, вам также необходимо изучить характеристики этого предмета, которые вы пытаетесь надеть на себя.

Во второй части я опишу особенности этого теста, чтобы вы знали, какие знания вы должны иметь или выучить, если хотите сдать. Я постараюсь изо всех сил дать вам общее представление о том, что пытается проверить экзамен, поэтому я буду избегать простых описаний, таких как просто перефразирование схемы навыков сертификации.

В третьей части (до этого момента мы уже знаем, чего ожидать от сертификата) мы поймем, готовы ли вы в вашем конкретном случае и когда вам следует дважды подумать, чтобы получить этот значок. Понимание вещей о вас поможет нам проанализировать оставшуюся часть этой головоломки: ВАС. Ваша карьера, цели и мотивация - последняя и самая важная часть обсуждения.

1.a) Экосистема науки о данных

Понимание общего контекста области науки о данных необходимо, чтобы оценить, стоит ли сертификат того. Если вы слушали подкаст «На пути к науке о данных», вы знаете, что в отрасли все больше и больше обсуждаются темы, связанные с развертыванием, производством и разработкой программного обеспечения. С другой стороны, современные модели и академические дискуссии - не самые горячие темы (следующие скриншоты говорят все).

Говоря это, я не утверждаю, что понимание моделей не важно. На самом деле, это важно, но если эти темы сейчас не самые актуальные, то это потому, что обсуждение было в прошлом, и есть твердые знания о них (вы можете видеть, что стандартные курсы пытаются научить вас в первую очередь).

Вторжение MLOps стало одним из самых значительных ударов по индустрии искусственного интеллекта. Он стал настолько популярным, потому что нацелен на то, чтобы исправить все, что в последние годы пошло не так с наукой о данных. Возможно, вы уже знаете о проблемах, связанных с производством в области науки о данных. Тем не менее, если вы этого не сделаете, показатели успеха шокируют.

Кроме того, эпизод «оставление академических кругов в пользу промышленности» отражает критический момент: машинное обучение уходит из академических кругов, и это хорошо! Если они обнаруживают что-то экстраординарное, для отрасли естественное массовое распространение. Опять же, вам не нужна докторская степень. больше; вы можете получить работу и создавать отличные приложения для искусственного интеллекта без ученой степени (книги тоже об этом утверждают).

Как вы можете видеть на графиках тенденций Google, MLOps привлекает внимание невероятно быстро, но обычные термины и модели (глубокое обучение, случайный лес и xgboost) стабильны.

С другой стороны, облачные платформы разрабатывают все больше и больше интеграций в соответствии с принципами MLOps, например, управление версиями данных и моделей или создание интеграций Kubernetes как AKS или EKS. Их цель - сделать ваш опыт более комфортным, и они отлично справляются со своей задачей. При этом вы склонны использовать их платформы на всех этапах непрерывного цикла машинного обучения.

У трех ведущих поставщиков облачных услуг есть небольшая положительная динамика, и если мы хотим знать, что произойдет с этой тенденцией, отличным источником является Gartner. В своей 10 главных тенденциях в области данных и аналитики на 2020 год они описывают, что облачные сервисы будут иметь важное значение для 90% инноваций в области данных и аналитики. Итак, облако никуда не денется.

1.b) Контекст облачных сертификатов Data Science

Требуются ли сертификаты на новых рабочих местах? Что ж, после прочтения кучи статей, в которых проверяются наиболее востребованные навыки специалистов по обработке данных, я могу сказать, что работодатели требуют наличия навыков, но сертификат - это просто «приятно иметь».

Когда мы говорим об ИТ-сертификации, в большинстве случаев вас проверят, насколько хорош ваш домен в ТЕХНОЛОГИИ. Тем не менее, технологии почти всегда связаны со знанием другой конкретной предметной области.

Примером может служить облачная сертификация архитектуры. В них вам нужно знать особенности использования этих облачных инструментов, но вам также необходимо уметь понимать общие архитектурные принципы.

Всегда сложно определить, насколько оценка будет проверять технологию и знания в конкретной предметной области. Типичный сценарий - это попытка измерить технологию на протяжении большей части теста и опыт в конкретной предметной области именно тогда, когда это необходимо.

Но когда мы говорим о науке о данных, проводя эту черту, это сложнее, чем обычно, потому что выполнение проектов машинного обучения требует глубокого понимания всех этапов цикла, что подразумевает конкретные варианты использования для каждой отдельной части процесса.

Таким образом, мы можем гарантировать, что технологическое приложение настолько тесно связано с реальным сценарием, что всегда предполагает наличие определенных знаний в данной области знаний. Вот почему я думаю, что этот экзамен (и другие сертификаты по облачному машинному обучению) в конечном итоге пытается измерить ваши навыки как в области использования технологий, так и в области обработки данных.

Это похоже на то, когда вы решаете поправиться и говорите своему тренеру следующее: «Назовите мне процент от того, сколько мне следует сосредоточиться на питании, а сколько на тренировках». Ну, вы не можете построить круговую диаграмму с этим. ! Потому что оба они необходимы, поэтому вы не можете думать в одном без другого.

2.а) А как же DP-100?

На странице экзамена Microsoft вы можете найти следующее:

«Специалист по данным Azure применяет свои знания в области науки о данных и машинного обучения для реализации и выполнения рабочих нагрузок машинного обучения в Azure; в частности, с помощью службы машинного обучения Azure. Это влечет за собой планирование и создание подходящей рабочей среды для рабочих нагрузок в области обработки данных в Azure, проведение экспериментов с данными и обучение прогнозных моделей, управление моделями и их оптимизацию, а также развертывание моделей машинного обучения в производственной среде ».

И это интересно, потому что это почти полное определение того, что представляет собой MLOps. Экзамен хорошо осведомлен о тенденции MLOps, и я думаю, что это здорово, потому что вы узнаете большинство операционных шагов, которые можно найти в проектах машинного обучения.

Еще одна важная сторона этого анализа - это задаваемые вопросы и то, насколько они будут измерять ваше техническое мастерство и опыт машинного обучения.

На очень высоком уровне есть хорошее сочетание вопросов, пытающихся проверить ваши знания по обоим из них: вы найдете некоторые, которые требуют глубокого понимания процесса науки о данных и мало - технологии, другие, где вы будете быть протестированным на предмет специфики инструментов Машинное обучение Azure и почти ничего о науке о данных, и, в большинстве случаев, вам нужно будет понимать и то, и другое.

2.b) Учитывая, что этот экзамен проверит ваши знания в области науки о данных, насколько хорошо он проходит?

Что ж, я думаю, что это амбициозно - проверить свои способности в области анализа данных и одну технологию одновременно (даже попытка проверить свои навыки в области анализа данных в одном тесте может быть нелепой). Из-за этого я бы сказал, что, несмотря на то, что этот тест ДЕЙСТВИТЕЛЬНО проверяет ваши знания в области машинного обучения, трудно быть уверенным, что сдавший экзамен человек знает все о науке о данных.

И именно это может быть одной из причин, почему облачные сертификаты для обработки данных по-прежнему не так высоко ценятся работодателями. Вы можете быть ассоциированным специалистом по анализу данных Azure, но сложно сказать наверняка, есть ли у вас все навыки, необходимые для работы инженером по машинному обучению.

2.c) А как насчет вопросов по технологии

Вопросы об этой конкретной технологии делают свою работу. Они созданы с учетом реальных сценариев использования. Это пропитывает тест некоторым ощущением реальности, что я считаю очень важным, когда вы хотите проверить способность использовать технологию в конкретном контексте.

Они проверяют, знаете ли вы, как применять технологию в различных сценариях, для этого будет недостаточно, если вы научитесь использовать Azure Machine Learning SDK.

Я думаю, что технологическая сторона этого сертификата является самой сильной, потому что на вашем пути обучения вы будете очень часто кивать перед экраном, впечатленные тем, насколько хорошо Azure соединяет все точки, чтобы внедрить модели машинного обучения в производство.

3) Подхожу ли я?

Прежде чем переходить к конкретным случаям, позвольте мне дать вам общий обзор этой сертификации. Как мы уже обсуждали ранее, экосистема науки о данных постоянно развивается и ожидает от вас разных вещей в зависимости от новых контекстов.

Знание того, как преобразовывать модели в реальные производственные системы, становится ценным активом, и Microsoft это знает. У них есть команды, работающие над улучшением службы машинного обучения Azure с учетом этих принципов. И, как мы также видели, облачная инфраструктура получит широкое распространение в аналитической индустрии.

По только что указанным причинам, если у вас есть некоторый опыт в области науки о данных и Azure, эта сертификация может дать вам небольшой толчок, необходимый для расширения ваших технических навыков.

Но после общей рекомендации этого сертификата позвольте мне поднять несколько белых и красных флажков. Как вы знаете, эта статья посвящена тому, чтобы «соответствовать» этому тесту, и в зависимости от стадии вашей карьеры и причин, по которым вы должны сдавать этот экзамен, этот сертификат может или не подойти вам правильно. в настоящее время.

3.a) Некоторые красные флажки

Если вы делаете свои первые шаги в науке о данных, я могу сказать, что вы не подходите для этого сертификата, и это не связано с вашей способностью его сдать. Вам будет сложнее, чем опытному специалисту по данным, но не невозможно. Вы можете выучить каждую команду, выполнить каждую лабораторную работу и запомнить весь жизненный цикл машинного обучения, и вы можете пройти.

Проблема в том, что вы не сможете понять, почему каждый предмет используется таким особым образом, и если вы не можете смешать это со своим прошлым опытом, знания не закрепятся на правильном пути.

Так что, если вы только начинаете, вам следует потратить свое время на изучение основ. Вам следует начать понимать некоторые алгоритмы, изучать общие фреймворки и выполнять свои первые практические проекты. Вот отличный пост по этому поводу.

Еще один красный флаг - на случай, если вы ожидаете быстрой финансовой отдачи. Что я имею в виду? Если вы думаете, что это напрямую даст вам новую работу или повышение, вы можете почувствовать разочарование. Потому что нет гарантии, что работодатели посмотрят на это свидетельство в вашем резюме и сразу же наймут вас.

Итак, если вы хотите быстро получить повышение или, возможно, устроиться на новую работу, могут быть лучшие краткосрочные варианты для этого. Но если вы указываете на среднесрочную перспективу для достижения той же цели, ваша способность изучать новые инструменты и постоянно бросать вызов себе в поисках новых способов выполнения работы будет высоко оценена. Боже! Я так быстро двигаюсь вперед, это часть следующего раздела !.

3.b) Идеально подходит!

Самой важной мотивацией для прохождения этого теста должно быть ваше желание учиться и расти. Я знаю, что это может показаться клише, но, как мы уже обсуждали ранее, этот сертификат сам по себе не даст вам прямого доступа к работе вашей мечты. Потому что для работодателей это еще не так важно.

Если ваша мотивация - учиться, вам не понадобится много опыта работы с Azure. Тем не менее, очевидно, что вам потребуется немного больше практической практики, чем людям, у которых она была. Но я думаю, что если вы правильно подготовитесь, то сможете пройти.

Еще один важный момент, который я хочу затронуть, - это стать «независимым от облака», что означает, что ваши возможности выходят за рамки любого облака. Если вы достигнете этого, это означает, что вы можете запускать рабочие нагрузки независимо от облачного провайдера. Это должно быть здорово, если вы работаете консультантом или хотите.

Интересно, что эта концепция может ввести людей в заблуждение, отказаться от изучения каких-либо облачных технологий и просто учиться, когда они вынуждены. Итак, НЕ ДЕЛАЙТЕ ЭТОГО, единственный способ стать по-настоящему «агностиком в облаках» - это понять каждую из их сильных и слабых сторон.

Другой случай может заключаться в том, что у вас большой опыт машинного обучения в Azure. Если это так, я думаю, вам тоже стоит пройти этот тест! Я думал, что много знаю об услугах Azure. Тем не менее, глядя на лабораторные работы и вопросы, вы могли бы подкрепить свои знания, и, ища сертификаты других облачных провайдеров, было бы неплохо, если бы вы разобрались в платформе, используемой для онлайн-тестирования.

До скорой встречи!

Я рассматриваю сертификаты как ускорители. Возможно, вы захотите узнать что-то новое, и я думаю, что это проще, если у вас есть конкретная цель.

Я очень надеюсь, что вам понравилась эта статья или вы нашли ее полезной. Я думал о создании руководства по DP-100, поэтому, если вы этого хотите, дайте мне знать и поддержите эту статью.

Если вам понравилось, подписывайтесь на меня на Medium и Linkedin. Если хочешь написать мне, я недавно в Твиттере. Я с удовольствием с вами пообщаюсь!

Если вы хотите прочитать еще немного, посмотрите некоторые из моих последних сообщений: