От бесплатных каналов YouTube до курсов Udemy

Похоже, это могло наконец случиться.

Инжиниринг данных, наконец, получает немного света.

В этом есть смысл.

Сохраняемые и анализируемые данные не только становятся более объемными, но и становятся все более быстрыми, сложными и разнообразными, что затрудняет споры.

Вместе со всеми этими новыми данными появляются новые инструменты, передовые практики и методы для управления и оптимизации систем данных, на которые мы полагаемся.

Хотя я много лет работал консультантом в качестве Сиэтла Data Guy, я все еще постоянно изучаю и пересматриваю лучшие курсы инженерии данных, чтобы улучшить свои навыки и понимание. Просмотрите следующие курсы с высокими оценками, которые мне понравились, и подумайте, какие из них могут быть лучшими для следующего шага в вашей карьере.

Как выбрать лучшие онлайн-курсы?

Не позволяйте количеству курсов, доступных в Интернете, ошеломить вас. Если вы не знаете, с чего начать, или проходите слишком много курсов одновременно, как я, то поищите курс, который предлагает эти функции.

Сосредоточьтесь на ключевых инструментах и ​​навыках

Существует целый мир инструментов и технологических стеков, начиная от Azure, AWS, Streaming, SQL, Python и множества других инструментов, которые вы используете или будете использовать в своей карьере. Некоторые отличные онлайн-курсы по инженерии данных предоставляют большой практический опыт, в то время как другие сосредоточены на теоретических знаниях и передовых методах.

Начни с бесплатного

Когда дело доходит до изучения инженерии данных, существует множество вариантов. Но сначала вам нужно решить, нравится ли вам та работа, которую делают инженеры по данным. Поэтому я рекомендую посмотреть некоторые каналы YouTube, где обсуждаются концепции и инструменты, которые используют инженеры по данным. Я буду ссылаться на два из них ниже, но я просто хотел дать вам этот совет, прежде чем мы продолжим.

Выберите курс с высоким рейтингом и посещаемостью

Большинство систем онлайн-курсов имеют рейтинг и публикуют статистику посещаемости. Такие платформы, как Udemy и Coursera позволяют легко находить интересные курсы. Тот факт, что курс посещают или оценивают, не означает, что он предлагает необходимые навыки, но это полезная функция для сравнения.

С осторожностью относитесь к курсам, на которых покупаются поддельные отзывы, но это, по крайней мере, место для начала.

Лучшие курсы по инженерии данных

За эти годы я прошел множество онлайн-курсов, но эти шесть вариантов - одни из лучших курсов по инженерии данных для начала.

1. Учебники WiseOwl

В этой серии бесплатных видеоуроков содержится полезная информация, позволяющая получить базовые знания об инструментах Microsoft, таких как SQL Server, SSIS и т. Д. Освежите основы или начните свое путешествие с Учебников WiseOwl в качестве хорошего учебника.

Ознакомьтесь с руководствами по инструментам SQL и ETL. Эти видео могут помочь вам научиться перетаскивать пункты назначения и преобразования в рабочее пространство. Плейлист SQL - хорошая отправная точка для этих навыков.

Всем нравится бесплатный курс, но в этих плейлистах отсутствуют некоторые функции. Мне не нравится, что в нем нет подробностей о том, почему нужно выполнять определенные действия - эта высокоуровневая архитектура является ключевым элементом головоломки инженера.

2. Учебное пособие по Apache Airflow

Еще один бесплатный вариант - серия Учебник по Apache Airflow Youtube. Эта серия состоит из семи видеороликов, которые дадут вам отличные базовые знания об Airflow.

В нем рассматриваются основные функции Airflow, который используется для улучшения традиционного представления ETL. Многие профессионалы используют этот инструмент для создания сотен и тысяч конвейеров более управляемым способом. Вы узнаете больше о Airflow DAG и будете готовы создать свой первый конвейер.

Как и учебные пособия WiseOwl, в этой серии больше внимания уделяется конкретным этапам использования инструмента, а не общей причине. Это отличное место для начала, но убедитесь, что вы получите это понимание на более высоком уровне, прежде чем отправиться в поле в качестве инженера.

3. Основы хранилищ данных для начинающих

Первый платный курс в моем списке, курс Udemy Основы хранилищ данных для начинающих - отличный способ изучить лучшие практики и высокоуровневые концепции архитектуры и размерного дизайна в удобном предложении курса.

Неудивительно, что этот курс стал бестселлером; он отлично объясняет, как использовать ETL и хранилища. Он исследует необходимые вам навыки, такие как создание промежуточных слоев, таблиц фактов и таблиц измерений, но также объясняет схемы и структуры этих инструментов.

Отличным дополнением к этому курсу является информация о медленно меняющихся размерах. Это позволяет не только копировать базу данных, но и добавлять контекст и отслеживать его исторически.

4. Большие данные в веб-сервисах Amazon (AWS)

Важно изучить концепции больших данных и инструменты веб-сервисов. Осветите эти области с помощью курса Удеми Большие данные в веб-сервисах Amazon. Этот курс дороже, чем другие предложения, но Udemy обычно предлагает на него скидку.

Основное внимание в этом курсе уделяется AWS, поэтому шаги, связанные с конкретным инструментом, могут не соответствовать другим облачным моделям. Однако теоретические концепции будут очень похожи, если вы используете GCP или Azure.

Вам нужно будет посвятить этому курсу больше времени, поскольку видеоролики, как правило, длятся немного дольше. Некоторые видео длятся от 15 до 18 минут, что, на мой взгляд, немного длиннее идеального. Делайте заметки по пути, чтобы не сбиться с пути.

5. Укрощение больших данных с помощью Apache Spark и Python

Вы не ошибетесь, если выберете курс Фрэнка Кейна. Курс Укрощение больших данных Удеми - личный фаворит, но многие из его курсов полезны и высоко оценены.

Это обучение дает вам строительные блоки и практические задания в Spark и Python. Переход от классной комнаты к реальным приложениям всегда будет происходить, но Фрэнк Кейн отлично справляется с некоторыми из этих пробелов и помогает вам увидеть, как эти инструменты работают в реальных задачах.

6. Введение в проектирование озер данных на AWS

Эта область дизайна популярна в этой области, поэтому добавьте ее в свой список онлайн-курсов. На Coursera Введение в проектирование озер данных на AWS дает вам общие концепции и более конкретные навыки по созданию и эксплуатации озера данных.

Как и большинство курсов Coursera, первая неделя носит общий характер и ее можно пропустить, но вторая неделя начинается с информации об AWS и архитектуре озера данных. Он более конкретный, чем другие курсы по большим данным, поэтому является хорошим дополнением к списку.

Где я могу узнать больше о инженерии данных?

Эти курсы инженерии данных дадут вам ускоренный курс продолжительностью от 3 до 6 месяцев, если не дольше, так что не торопитесь.

Не торопитесь и изучите основы. Понизьте свой базовый уровень навыков инженерии данных, и тогда, когда вы начнете работать, вы найдете множество возможностей бросить вызов себе с новыми проблемами.

Однако, если вы ищете новые возможности для обучения прямо сейчас, наша команда работает над статьей о применении ваших навыков инженера данных в проектах инженера данных.

Я всегда ищу новые курсы, которые можно пройти и передать другим профессионалам, поэтому не стесняйтесь обращаться ко мне с любыми вопросами или рекомендациями по курсам. Начните с руководств WiseOwl или пройдите эти шесть лучших курсов по-своему, чтобы улучшить свои навыки и концептуальные знания.

Подпишитесь на нашу рассылку новостей

Прежде чем прокручивать дальше, почему бы не подписаться на информационный бюллетень нашей команды, чтобы быть в курсе событий в области науки о данных, инженерии данных и технологий! Подробнее здесь.