Это определенно было непросто, и я получил отличный опыт от начала до конца.

Всем привет, я недавно прошел тест GCP Professional Data Engineer в середине мая 2022 года. Мало кто обращался ко мне за советом, я собираюсь поделиться здесь своим опытом в надежде помочь вам сдать экзамен. Удачи!

Мне было трудно получить все ресурсы, необходимые для учебы и практики. Итак, я подумал, что было бы здорово, если бы я мог собрать все в одном месте, чтобы помочь другим кандидатам PDE в эффективной подготовке к экзамену, включая все ссылки на все ресурсы, упомянутые в истории. Основная цель этой публикации – поделиться ключевыми моментами, примечаниями и учебными материалами для экзамена.

Мой фон:

Прежде всего, я инженер данных с примерно 3,5 годами опыта работы с GCP и 4+ в целом. Я всегда хотел стать инженером облачных данных Google, потому что это лучший поставщик облачных услуг для аналитики, который предлагает самые передовые технологии для решения реальных проблем. У меня есть практический опыт работы с несколькими продуктами GCP, такими как Bigquery, Data Fusion, Composer, GCS, Stackdriver и DataProc. Итак, пока я готовлюсь к сертификации, большинство продуктов мне еще незнакомы.

Об экзамене: Google Cloud Certified Professional Data Engineer

  • Количество вопросов: 50
  • Формат экзамена: Множественный выбор с множественным выбором (без тематических исследований)
  • Продолжительность экзамена: 2 часа (вы можете уйти, как только закончите)
  • Сбор за регистрацию: 200 долларов США (плюс налог, если применимо).
  • Срок действия: 2 года.
  • Рекомендуемый опыт: более 3 лет опыта работы в отрасли, включая более 1 года разработки и управления решениями с использованием Google Cloud (не обязательно).
  • Языки: английский, японский.
  • Режим экзамена: онлайн-наблюдение и контроль центра тестирования.
  • Результаты: вы получите результат (ПРОШЕЛ/НЕ ПРОШЕЛ) сразу после нажатия кнопки отправки. Официальный сертификат будет отправлен вам на ваш зарегистрированный почтовый ящик примерно через 2–5 рабочих дней. (Я получил это сразу после дня экзамена)
  • Привилегии. Это самое интересное: как только вы пройдете сертификацию, Google Cloud отправит код ваучера вместе с сертификацией в качестве знака достижения. Вы можете выкупить его один раз и выбрать любой из доступных продуктов.

Трек обучения

Основы:

  1. Читать обзор экзамена Professional Data Engineer
  2. Прочитать руководство к экзамену на Professional Data Engineer
  3. Понимать продукты, предлагаемые Google Cloud, которые имеют отношение к темам руководства по экзамену. Если вы новичок в облаке Google, то рекомендуется пройти Курс основ GCP.

Общая схема обучения:

Как только вы получите представление обо всех продуктах, которые использует инженер данных в GCP, пришло время применить эти знания на практике, то есть на практических занятиях. Существует множество обучающих платформ, которые предлагают практические занятия (qwiklabs) с подробными объяснениями. Из всех ресурсов ниже приведены некоторые:

  1. Официальное учебное пособие Google Cloud Certified Professional Data Engineer
  2. Интернет-ресурсы, такие как Acloudguru, Pluralsight и Coursera.
  3. Официальная документация Google Cloud
  4. Примеры вопросов GCP PDE
  5. Практические тесты (выполняйте, пока не наберете 90% на каждом экзамене): Дэн Салливан — Удеми, Whizlabs

Мое учебное пособие:

  1. Курс основ GCP Джанакирама MSV: Для понимания основ GCP.
  2. Инженерия данных, большие данные и машинное обучение по специализации GCP
  3. Официальная документация Google Cloud
  4. GCP Study Guide Ивама Луиса
  5. Статьи GCP Data Engineering на Medium
  6. Практические тесты: я сделал в общей сложности 8 практических тестов, чтобы компенсировать мое короткое время обучения в 3 недели (высокоинтенсивное обучение, лол)
  7. Шпаргалка по инженерии данных Google, Маверик Лин
  8. Видео за минуту от Google Cloud Tech: они ваши лучшие друзья за день до экзамена, чтобы быстро повторить все концепции.

Прежде чем начать подготовку к сертификации, первое, что я сделал, это записал свое общее понимание GCP, например, в каких концепциях я был уверен, в каких продуктах у меня есть хороший опыт работы и в каких архитектурах я работал над GCP. Это дало мне общее представление о моем опыте в GCP. После оценки этого было явно недостаточно, когда я попытался сдать пробный экзамен, я правильно ответил на 60% вопросов, а большинство неправильных ответов были на лучших практиках. Итак, я составил трехнедельный план подготовки.

Неделя-1:

Еще в 2020 году я закончил курс Инженерия данных, большие данные и машинное обучение по специализации GCP, поэтому быстро пересмотрел большинство видео на 2X. После этого я дал один тренировочный тест на wizlabs и получил 45%. Как обычно, большинство неправильных ответов касаются рекомендаций, ценообразования и соединения нескольких продуктов Google друг с другом.

Я решил больше сосредоточиться на лучших практиках, концепциях оптимизации производительности и оптимизации затрат известных продуктов GCP, используемых в Data Engineering, таких как Bigquery, Bigtable, Dataproc, Dataflow и реляционные базы данных. В первую неделю подготовки мне удалось закончить Storage, Databases, Analytics (кроме ML), и мой результат сразу улучшился в большинстве практических тестов. Приятно видеть прогресс, поскольку он усиливает ваше намерение учиться еще больше.

Неделя-2:

На второй неделе я в основном сосредоточился на части сертификации ML, поскольку 35% вопросов в PDE связаны с услугами GCP ML и их использованием. Я рассмотрел все концепции и варианты их использования с лучшими практиками за 3 дня и начал давать практические тесты по этим концепциям. Здесь часть вопросов, связанных с ML, в основном касается сценариев и того, какой продукт GCP использовать, и большинство из них касается функций и операций ML.

Для ML я изучил в основном официальную документацию (у меня нет предварительных знаний об ML), все было сокращено до погони, и я предлагаю вам сделать то же самое. Кроме того, несколько блогов по терминологии и функциям ML, так как я был очень плохо знаком с ML.

Неделя-3:

Последняя неделя была для меня решающей для понимания концепций вычислений, сетей, мониторинга, безопасности, миграции и услуг по передаче данных, а также пересмотра недель 1 и 2. Большинство практических вопросов по этим концепциям представляют собой смесь сервисов, и если вы лучше понимаете архитектурные потоки, это наверняка пригодится, чтобы ответить на большинство вопросов.

Я сдал два пробных экзамена за два дня до экзамена и набрал 85 и 95 баллов, я был уверен, что сдам экзамен. Буквально за день до экзамена я просмотрел Шпаргалку по инженерии данных Google от Маверика Лина, в которой в общих чертах охвачено почти все, и большинство продуктов описаны с наилучшими вариантами использования. Далее я посмотрел минутное видео на канале Google Cloud Tech на Youtube (чтобы быстро пересмотреть все концепции).

Советы для экзамена

  • Попробуйте выполнить как можно больше тренировочных тестов, это даст практический подход к решению вопросов, а также увеличит вашу скорость ответов.
  • Google хочет протестировать нас на своих основных продуктах, а иногда и на миксе рецептов инженерии данных, поэтому было бы неплохо прочитать несколько статей в блогах о передовом опыте инженерии данных.
  • Если вы запутались, всегда выбирайте продукт GCP вместо других решений, ведь экзамен проходит в Google Cloud.
  • Экзаменационные вопросы аналогичны типовым вопросам, но в 3–4 раза (сложнее и сложнее).
  • Получите четкое представление о мониторинге, они всегда смешиваются с другими сервисами GCP, такими как BQ и хранилище.
  • Поймите терминологию и словарный запас ML, у меня были проблемы с ответами на вопросы ML во время практических тестов, и это помогло на более поздних этапах.

Я создал заметки по конкретным продуктам, а также важные темы для каждого предложения GCP в PDE. Вы можете найти его здесь.

Во время экзамена

  • Наблюдатель все настроит за вас, а затем вы начнете экзамен, согласившись с условиями. Просто держите клавиатуру как можно дальше, так как большинство компьютеров, которые они используют на экзамене под наблюдением, очень старые.
  • Будет паника, напряжение и страх, но не беспокойтесь, если вы выполнили практические тесты, вы сможете отвечать даже на неизвестные вопросы благодаря практическому подходу, который вы применяли во время этих практических тестов.
  • Если вы застряли на каком-то вопросе, не тратьте слишком много времени, просто отметьте его для рассмотрения и переходите к следующему.
  • Всегда полагайтесь на свои инстинкты, отвечая на запутанный вопрос (вы готовы к этому, множественные практические тесты, которые вы прошли, сделают волшебство здесь)

После экзамена

  • Когда вы закончите экзамен, вам будет выставлена ​​только оценка зачетно или незачетно.
  • На вашем экране видно, что Google отправит ваши официальные результаты в течение 7–10 дней, но у меня это заняло всего 14 часов.
  • Вместе с официальными результатами вы также получите код погашения вместе с официальным сертификатом Google Cloud Professional Data Engineer и значком.
  • Вы можете активировать код в Интернет-магазине Google Cloud Certification Perks и выбрать любой из доступных бонусов. Я выбрал серую толстовку и все еще жду ее доставки.

Учитесь у других сертифицированных инженеров по обработке данных:

Заключение:

Моим главным выводом из этого процесса были знания, которые я получил от продуктов GCP и его аналитических предложений, а также сертификация хорошо смотрится в моем резюме. К тому времени, когда вы закончите подготовку, у вас будет все, что может сделать вас архитектором в проектировании конвейеров проектирования данных. Путешествие по подготовке к этому экзамену проведет вас через несколько реальных случаев использования и проверит ваши знания в некоторых из самых сложных ситуаций. Эта подготовка изменила мое представление о сервисах обработки данных в GCP, надеюсь, вы пройдете через то же самое.

Удачи!

Вы всегда можете связаться со мной в LinkedIn. Я буду рад помочь коллеге-энтузиасту GCP.

Спасибо Sathish VJ и Priyanka Vergadia за вдохновение!