Машинное обучение AWS — это новейшее дополнение к сертификационному набору AWS, и, поскольку в нем есть слово Машинное обучение, многие люди заинтересуются им. Даже те, кто не в восторге от AWS. Недавно я сдал этот экзамен и набрал 955/1000. Я был немного удивлен этой оценкой, так как я мало учился и у меня не было сертификата младшего специалиста. Так что либо мне просто повезло, либо я что-то сделал не так. Я предпочитаю верить в последнее, и именно поэтому я пишу этот пост!

Что такое специальный экзамен по машинному обучению AWS?

Раскроем имя. Во-первых, это экзамен. Вы идете в тестовый центр, сидите там 3 часа и отвечаете на 65 вопросов с несколькими вариантами ответов. Основываясь на ваших правильных ответах, они дают вам оценку от 100 до 1000 с проходным баллом 750. Теперь к части «Сертифицировано». Если вы проходите, вы получаете сертификат от AWS, который вы можете рекламировать другим, чтобы чувствовать себя лучше. себя. Что касается машинного обучения, то они проверяют вашу способность использовать проблемы машинного обучения в реальном мире с помощью AWS. В основном это включает в себя сбор данных, предварительную обработку, обучение модели и развертывание ее в рабочей среде. Немного безопасности разбрызгивается вокруг, так что вы не потеряете свои данные в процессе. Все это вы делаете с помощью сервисов AWS, хотя есть вопросы о чистом прикладном ML (не Math ML), большинство из них так или иначе связано с предложениями AWS.

Кто должен сдавать этот экзамен?

Если вы работаете с прикладным машинным обучением на AWS или даже с другими облачными сервисами, этот экзамен может помочь. В целом, если вы интересуетесь наукой о данных, этот экзамен вам подойдет. Вы узнаете, какие решения создают умные люди в AWS. Это также даст приблизительную оценку ваших навыков работы с данными. Лучше иметь опыт машинного обучения. В противном случае вам нужно сначала понять основные понятия. Также рекомендуется, чтобы у вас был сертификат младшего специалиста в AWS, прежде чем пытаться сдать специальный экзамен, однако, если у вас есть некоторый практический опыт, этого должно быть достаточно.

Чего ожидать на экзамене?

На эту тему есть более подробные статьи. Я связал их в конце.

Вы должны знать следующие сервисы AWS

  • SageMaker
  • Повторяю, SageMaker
  • Кинезис
  • Клей
  • Немного об Athena, Redshift, EMR, S3 (высокий уровень)
  • Управляемые AWS сервисы «ИИ» (Понимание, Распознавание, Перевод, Расшифровка и т. д.)

Вы должны знать следующее о машинном обучении

Как обучить свою модель (извините, если вы ожидали дракона)

  • Выявление проблемы (контролируемый, неконтролируемый, классификация, регрессия и т. д.)
  • Алгоритмы машинного обучения (линейные модели, CNN, RNN, Tree Ensemble и т. д.)
  • Метрики (точность, полнота, RMSE, AUC и т. д.)
  • Настройка гиперпараметров, недообучение, переоснащение и т. д.

Как подготовить данные

  • Преобразование данных (горячее кодирование, масштабирование, биннинг и т. д.)
  • Обработка пропущенных значений (вменение, удаление и т. д.)
  • Разделение данных (train-test-validation)

Как приготовиться?

Вот ресурсы, которые я использовал

Курс Cloud Guru ML

Это фантастический всесторонний ресурс, который охватывает все основы. Я настоятельно рекомендую его в качестве отправной точки. Имейте в виду, что он предназначен для всех аудиторий. Вы можете найти объяснение банальностей для всего видео; эти части можно пропустить. У них также есть лабораторные работы, которые могут быть полезными, но их можно пропустить, если у вас мало времени. Хотя хоть лабы смотри, чтоб практику знать. Он также включает в себя полноценный практический экзамен. Предупреждение здесь заключается в том, что практический экзамен находится в стадии бета-тестирования, и они являются гуру облачных вычислений, а не гуру машинного обучения. Их вопросы часто немного менее зрелые, чем настоящие вопросы, которые вы найдете на экзамене. Иногда встречаются концептуальные ошибки, например, говорят, что показатель F1 можно использовать для регрессии, что не так.

Все это стоит 29..99 долларов за месяц доступа. Тем не менее, у них есть пробная версия на одну неделю, поэтому, если вы можете пройти курс и практический экзамен за неделю, вы можете сэкономить эти деньги. Загляните здесь.

Путь машинного обучения AWS

На этой странице AWS перечисляет бесплатные онлайн-курсы, которые вы можете пройти, чтобы подготовиться. Большинство из них более или менее полезны, за исключением курса безопасности. Однако, в зависимости от вашего образования, вы можете пропустить базовые курсы. Самые продвинутые курсы часто слишком сложны для этого экзамена, но они также самые увлекательные, поскольку настоящий специалист по данным рассказывает о передовых решениях, таких как DSSM.

Белые книги AWS

Я пропустил 1000-страничное Руководство разработчика SageMaker, чтобы впитать в себя как можно больше. Хотя, возможно, есть лучший способ. Для Kinesis я прочитал этот документ. Я уже достаточно знал о Glue, но вы, возможно, захотите прочитать что-нибудь и об этом сервисе.

Видео AWS TechTalk и DeepDive на Youtube

Обо всех этих сервисах есть много отличных видео, где инженеры, которые их построили, рассказывают о деталях. Тем не менее, возможно, вы узнаете больше вещей, которые не нужны для экзамена. Так что ныряйте глубоко, это весело, но держите трубку в воздухе.

Практический тест AWS

Вы можете купить это у AWS за 40 баксов. Это всего лишь часовой тест с 20 вопросами, что является обломом. Тем не менее, это самое близкое к реальному экзамену. Я думаю, что было бы разумно пройти этот тест в качестве последней проверки, чтобы увидеть, готовы ли вы к работе или вам нужно больше практики.

В день экзамена

Научитесь исключать варианты

Часто я довольно уверенно отвечал на вопросы, даже когда мало что знал о правильном ответе. Устранение неправильных вариантов всегда работает для вопросов с несколькими вариантами ответов, но для этого экзамена это работает слишком хорошо (возможно, даже больше, чем должно). Они часто задают трудный вопрос, а затем отказываются от всего этого в вариантах. Вот некоторые приемы устранения

  • Использование неправильного сервиса/алгоритма. В этом варианте могут быть и другие вещи, что имеет смысл, но этот жизненно важный элемент исключает его. Например, «Использовать Glue для запроса данных» или «Использовать случайный лес для классификации».
  • Используйте предвзятость AWS, если в замешательстве выберите сервис AWS, а не решение с открытым исходным кодом. Например, выберите AWS Glue вместо Hive Metastore.
  • Попробуйте идентифицировать Bull Sh * t. Есть варианты BS, которые используют пустой жаргон, но их легко обнаружить. Даже если вы не знаете точного ответа. Например, «использовать деревья авторегрессии» или «увеличить отсев в 3-м сверточном слое в два раза».
  • Старая добрая бритва Оккама в замешательстве выбирает вариант попроще.

Использовать флаг для проверки

  • Если вы хоть немного запутались в вопросе, вы можете пометить его для проверки и двигаться дальше. Убедитесь, что вы ответили на каждый отмеченный вопрос. Если вам придется некоторое время подумать над этим вопросом, вы сохраните какую-то идею, и чаще всего это будет лучшее, что вы можете придумать. Кроме того, оставление вопросов без ответов создает напряжение в конце.
  • Часто лучше вернуться, даже если у вас достаточно времени. Для меня часто путаница возникает из-за того, что я упустил ключ или неправильно понял вопрос. Когда я возвращаюсь, у меня более свежая перспектива, которая помогает найти ее быстрее.
  • Если вы похожи на меня и не хотите отказываться от отведенного времени, вы можете продолжать размышлять над этими отмеченными вопросами. Я отметил ~20 вопросов и потратил на них последние 40 минут, но изменил ответ только на один.

Не беспокойтесь слишком о времени

  • Трех часов более чем достаточно для ответа на эти 65 вопросов, так как они редко включают какие-либо расчеты. Вы можете ответить на них в течение 2 часов, если хотите.

Это все, что я должен сказать, удачи!

Дополнительные ресурсы