Введение

Два года назад я успешно сдал экзамен по специальности AWS Certified Data Analytics. В этой статье я хочу поделиться своим опытом и дать несколько советов и идей, которые могут быть полезны тем, кто готовится к экзамену.

Предпосылки для экзамена

Настоятельно рекомендуется пройти сертификацию AWS Solutions Architect Associate или Professional, прежде чем пытаться сдать специальный экзамен AWS Certified Data Analytics. Это обеспечивает прочную основу для платформы AWS и ее различных сервисов, которые имеют решающее значение для сдачи экзамена. Кроме того, хороший опыт работы с данными может улучшить ваше понимание обработки данных для машинного обучения.

Важность сильного опыта работы с данными

Наличие солидного опыта в области проектирования данных обеспечивает глубокое понимание конвейеров обработки данных, решений для хранения данных и передовых методов управления данными. Это может помочь в понимании того, как данные собираются, хранятся, обрабатываются и анализируются, что имеет решающее значение для построения эффективных и действенных моделей машинного обучения, а также для прохождения интерактивных интервью.

Преимущества сертифицированной AWS специальности Data Analytics

Стать сертифицированным специалистом по аналитике данных AWS не только улучшит ваши навыки, но и даст вам преимущество в собеседованиях архитекторов решений на белой доске. Эта сертификация демонстрирует ваш опыт работы с большими данными, хранением данных, машинным обучением и потоковой передачей данных, которые являются жизненно важными навыками для архитекторов решений.

Подготовка к экзамену

Сертифицированный экзамен по аналитике данных AWS представляет собой сочетание вопросов с несколькими вариантами ответов и вопросов, основанных на сценариях. Пять доменов и их соответствующие проценты экзамена:

  • Домен 1: Коллекция (18%)
  • Домен 2: Хранение и управление данными (22%)
  • Домен 3: Обработка (24%)
  • Домен 4: Анализ и визуализация (18%)
  • Домен 5: Безопасность (18%)

Я советую пройти специальный курс AWS Certified Data Analytics Specialty Exam Course и прочитать AWS Certified Data Analytics — Specialty (DAS-C01) Exam Guide. В этом руководстве представлен обзор экзамена и подробное описание пяти доменов.

Типы сценариев и хорошие ответы

Обратите внимание, что приведенная ниже информация о типах вопросов и правильных ответах является лишь теоретическим примером и не отражает реальных экзаменационных вопросов. Вопросы с несколькими вариантами ответов охватывают широкий круг тем, включая большие данные, хранилища данных, машинное обучение и потоковую передачу данных.

Один вопрос на основе сценария может касаться повышения производительности задания Apache Spark, которое часто запрашивает данные в Amazon S3 для заполнения панели аналитики. Варианты могут включать копирование исходных данных в Amazon Redshift, их копирование в HDFS, загрузку в Spark DataFrames, потоковую передачу в Amazon Kinesis и использование S3 Select. Хорошим ответом может быть копирование исходных данных в Amazon Redshift и переписывание кода Apache Spark для запроса Redshift, а также использование S3 Select для извлечения необходимых данных из объектов S3. Это хороший ответ, поскольку Redshift оптимизирован для аналитики и обеспечивает высокую производительность запросов, а S3 Select позволяет фильтровать данные непосредственно из S3, уменьшая объем передаваемых и обрабатываемых данных.

Другой вопрос, основанный на сценарии, может касаться создания информационной панели для отображения тенденций в социальных сетях в течение последнего часа крупного корпоративного мероприятия. Панель мониторинга должна иметь постоянную задержку менее 2 минут. Варианты могут включать использование Kinesis Data Firehose и Kinesis Data Analytics для приложений SQL, использование Elasticsearch и Kibana, использование Kinesis Data Streams и Athena, а также использование SNS, SQS, EC2 и Aurora MySQL. Хорошим ответом может быть публикация необработанных данных социальных сетей в потоке Kinesis Data Firehose, что позволит собирать и агрегировать данные в режиме реального и близкого к нему времени. Затем можно использовать Kinesis Data Analytics для приложений SQL для выполнения SQL-запросов к данным в режиме реального времени и отображения результатов на информационной панели. Это решение обеспечивает быстрый и масштабируемый способ обработки и анализа больших объемов данных социальных сетей с малой задержкой и может быть настроено в соответствии с конкретными потребностями корпоративного мероприятия. Кроме того, Kinesis Data Firehose и Kinesis Data Analytics — это полностью управляемые службы, которые могут обрабатывать большой поток входящих данных и обеспечивать постоянное обновление данных на информационной панели в режиме реального времени.

Заключение

В заключение хочу сказать, что экзамен AWS Certified Data Analytics Specialty Exam — это сложный и полезный экзамен, который охватывает широкий круг тем, связанных с большими данными, хранением данных, машинным обучением и потоковой передачей данных. Надеюсь, мой опыт и знания помогут вам подготовиться к экзамену и добиться успеха. Не забудьте иметь прочную основу в AWS, будучи сертифицированным специалистом по архитектуре решений или профессионалом, и хорошо разбираться в различных сервисах и вариантах их использования. Удачи!

Дополнительные материалы на PlainEnglish.io.

Подпишитесь на нашу бесплатную еженедельную рассылку новостей. Подпишитесь на нас в Twitter, LinkedIn, YouTube и Discord.

Повысьте узнаваемость и признание вашего технического стартапа с помощью Circuit.