Полтора года назад я бросил одну из лучших программ по информатике в Канаде. Я начал создавать свою собственную магистерскую программу по наукам о данных, используя онлайн-ресурсы. Я понял, что могу научиться всему, что мне нужно, с помощью edX, Coursera и Udacity. И я мог изучить его быстрее, эффективнее и за небольшую плату.

Я почти закончил. Я прошел много курсов, связанных с наукой о данных, и проверял некоторые из многих других. Я знаю, какие есть варианты и какие навыки необходимы учащимся, готовящимся к роли аналитика данных или ученого. Итак, я начал создавать ориентированное на обзоры руководство, в котором рекомендуются лучшие курсы для каждого предмета в данных. наука.

В качестве первого руководства из этой серии я порекомендовал несколько классов кодирования для начинающих специалистов по анализу данных. Тогда это были статистика и классы вероятностей. Затем Введение в науку о данных. Потом визуализация данных. Машинное обучение было пятым и последним руководством. А теперь я возвращаюсь, чтобы завершить эту серию с еще большим количеством ресурсов.

Вот краткое изложение всех моих предыдущих руководств, а также рекомендации по 13 другим темам в области науки о данных.

Для каждого из пяти основных руководств в этой серии я потратил несколько часов, пытаясь определить каждый онлайн-курс по рассматриваемому предмету, извлекая ключевые фрагменты информации из их учебных планов и обзоров и составляя их рейтинги. Моя цель состояла в том, чтобы определить три лучших доступных курса по каждому предмету и представить их вам.

По 13 дополнительным темам, таким как базы данных, большие данные и общая программная инженерия, не хватило курсов, чтобы оправдать полное руководство. Но в течение последних восьми месяцев я отслеживал их, когда сталкивался с ними. Я также поискал в Интернете курсы, которые, возможно, пропустил.

Для решения этих задач я обратился ни к кому другому, как к сообществу Class Central с открытым исходным кодом и его базе данных, содержащей тысячи оценок и обзоров курсов.

С 2011 года основатель Class Central Дхавал Шах пристально следит за онлайн-курсами, чем кто-либо другой в мире. Дхавал лично помог мне составить этот список ресурсов.

Как мы выбрали курсы для рассмотрения

Каждый курс в каждом руководстве должен соответствовать определенным критериям. Были предметно-специфические критерии, а затем два общих критерия, которые разделяло каждое руководство:

  1. Он должен предоставляться по запросу или предлагаться каждые несколько месяцев.
  2. Это должен быть интерактивный онлайн-курс, поэтому никаких книг или учебных пособий только для чтения. Хотя это жизнеспособные способы обучения, в этом руководстве основное внимание уделяется курсам. Курсы, которые являются строго видео (то есть без викторин, заданий и т. Д.), Также исключаются.

Мы считаем, что прошли все известные курсы, соответствующие критериям каждого руководства. Но всегда есть шанс, что мы что-то упустили. Пожалуйста, дайте нам знать в разделе комментариев к каждому руководству, если мы упустили хороший курс.

Как мы оценивали курсы

Мы собрали средние оценки и количество отзывов с Class Central и других сайтов с обзорами, чтобы рассчитать средневзвешенный рейтинг для каждого курса. Мы читали текстовые обзоры и использовали эти отзывы для дополнения числовых оценок.

Мы сделали субъективные суждения о программе, основанные на множестве факторов, специфичных для каждого предмета. Критерии в нашем введении к руководству по программированию, например:

  1. Освещение основ программирования.
  2. Освещение более сложных, но полезных тем в программировании.
  3. Какая часть учебной программы имеет отношение к науке о данных?

Вот лучшие курсы по каждой из этих тем. Вместе они образуют комплексную учебную программу по науке о данных.

Тема №1: Введение в программирование

Научитесь программировать: основы (LPT1) и Код качества создания (LPT2) Университета Торонто через Coursera

Серия курсов "Обучение программированию" Университета Торонто - это отличное сочетание сложности содержания и возможностей для начинающих специалистов по анализу данных. Преподаваемый на Python, серия имеет средневзвешенный рейтинг 4,71 звезды по 284 отзывам.

Введение в интерактивное программирование на Python (Часть 1) и (Часть 2) от Университета Райса через Coursera

Серия «Интерактивное программирование на Python» Университета Райса содержит два лучших онлайн-курса за всю историю. Они склоняются к играм и интерактивным приложениям, которые менее применимы в науке о данных. Сериал имеет средневзвешенный рейтинг 4,93 звезды по 6069 отзывам.

R Programming Track от DataCamp

Если вы настроены на изучение R, программа DataCamp R Programming Track эффективно сочетает в себе основы программирования и инструкции по синтаксису R. Он имеет 4,29-звездочный средневзвешенный рейтинг по 14 отзывам.

Тема № 2: Статистика и вероятность

Основы анализа данных - Часть 1: Статистика с использованием R и Часть 2: Выводная статистика Техасского университета в Остине через edX

Курсы из серии «Основы анализа данных» UT Austin - два из немногих с отличными обзорами, которые также обучают статистике и вероятности с упором на кодирование примеров. Сериал имеет средневзвешенный рейтинг 4,61 звезды по 28 отзывам.

Статистика со специализацией R от Университета Дьюка через Coursera

Программа Duke's Statistics со специализацией R, разделенная на пять курсов, включает обширную программу с полными разделами, посвященными вероятности. Он имеет средневзвешенный рейтинг 3,6 звезды по 5 отзывам, но курс, на котором он основан, имеет средневзвешенный рейтинг 4,77 звезды по 60 отзывам.

Введение в вероятность - наука о неопределенности Массачусетского технологического института (MIT) через edX

Курс Intro to Probability Массачусетского технологического института на сегодняшний день имеет самые высокие оценки среди курсов, рассмотренных в статистике и руководстве по вероятностям. Это исключительно вероятностный курс с мельчайшими подробностями, плюс он более длительный (15 недель) и более сложный, чем большинство МООК. Он имеет средневзвешенный рейтинг 4,82 звезды по 38 отзывам.

Тема № 3: Введение в науку о данных

Наука о данных от А до Я ™: упражнения по науке о данных в реальной жизни, Кирилл Еременко и команда SuperDataScience через Udemy

Data Science A-Z Кирилла Еременко отличается широтой и глубиной охвата процесса обработки данных. Рецензенты часто хвалят естественные обучающие способности преподавателя. Он имеет средневзвешенный рейтинг 4,5 звезды по 5078 отзывам.

Введение в анализ данных от Udacity

Введение в анализ данных Udacity охватывает процесс анализа данных с использованием Python. Он имеет 5-звездочный средневзвешенный рейтинг по 2 отзывам.

Основы науки о данных от Университета больших данных

Курс «Основы науки о данных» Университета больших данных охватывает весь процесс анализа данных и знакомит с Python, R и некоторыми другими инструментами с открытым исходным кодом. На сайтах, на которых проводился анализ, нет отзывов об этом курсе.

Тема № 4: Визуализация данных

Визуализация данных со специализацией на таблицах Калифорнийского университета в Дэвисе через Coursera

Серия из пяти курсов, UC Davis ’Data Visualization with Tableau Specialization, глубоко погружается в теорию визуализации. Возможности попрактиковаться в Tableau предоставляются посредством пошаговых руководств и финального проекта. Он имеет 4-звездочный средневзвешенный рейтинг по 2 отзывам.

Визуализация данных с помощью серии ggplot2 от DataCamp

При поддержке создателя ggplot2 Хэдли Уикхэма, значительный объем теории раскрывается в серии DataCamp's Data Visualization with ggplot2. Вы будете достаточно хорошо знакомы с R и его причудливым синтаксисом, покинув эти курсы. На обзорных сайтах, используемых для этого анализа, нет отзывов об этих курсах.

Tableau 10 Series (Tableau 10 A-Z и Tableau 10 Advanced Training) Кирилла Еременко и команды SuperDataScience на Udemy

Серия Tableau 10 Кирилла Еременко представляет собой эффективное практическое введение. В ней основное внимание уделяется охвату инструментов (Tableau), а не теории визуализации данных. Вместе эти два курса имеют средневзвешенный рейтинг 4,6 звезды по 3724 отзывам.

Тема № 5: Машинное обучение

Машинное обучение Стэнфордского университета через Coursera

Машинное обучение Стэнфордского университета, которое преподает знаменитый Эндрю Нг, основатель Google Brain и бывший главный научный сотрудник Baidu, охватывает все аспекты рабочего процесса машинного обучения и несколько алгоритмов. Преподаваемый в MATLAB или Octave, он имеет средневзвешенный рейтинг 4,7 звезды по 422 отзывам.

Машинное обучение Колумбийского университета через edX

Машинное обучение Университета КоИумбия - более продвинутое введение, чем Стэнфордское. Это новый курс с исключительными отзывами и уважаемым преподавателем. Задания курса могут быть выполнены с использованием Python, MATLAB или Octave. Он имеет 4,8-звездочный средневзвешенный рейтинг по 10 отзывам.

Машинное обучение A-Z ™: практический опыт Python и R в науке о данных Кирилла Еременко и Хаделин де Понтевес через Удеми

Машинное обучение от А до Я Кирилла Еременко и Хаделин де Понтевес - это впечатляюще подробное предложение, которое предоставляет инструкции как по Python, так и по R, что редко и нельзя сказать ни о каком из других лучших курсов. Он имеет средневзвешенный рейтинг 4,5 звезды по 8119 отзывам.

Тема № 6: Глубокое обучение

Творческие приложения глубокого обучения с TensorFlow от Каденце

Креативные приложения глубокого обучения с Tensorflow от Parag Mital вносят уникальный поворот в технический предмет. «Креативные приложения» вдохновляют, курс подготовлен профессионально, а преподаватель знает свое дело. Обучаемый на Python, он имеет средневзвешенный рейтинг 4,75 звезды по 16 отзывам.

Нейронные сети для машинного обучения Университета Торонто через Coursera

Учитесь у легенды. Джеффри Хинтон известен как крестный отец глубокого обучения и известен во всем мире своей работой над искусственными нейронными сетями. Его нейронные сети для машинного обучения - это продвинутый класс. Преподаваемый в Octave с упражнениями также на Python, он имеет средневзвешенный рейтинг 4,11 звезды по результатам 35 обзоров.

Deep Learning A-Z ™: практические искусственные нейронные сети Кирилла Еременко и Хаделин де Понтевес через Удеми

Deep Learning A-Z - это доступное введение в глубокое обучение с интуитивно понятными объяснениями от Кирилла Еременко и полезными демонстрациями кода от Хаделин де Понтевес. Преподаваемый на Python, он имеет средневзвешенный рейтинг 4,6 звезды по 1314 отзывам.

И вот наш лучший курс по каждому из дополнительных предметов в области науки о данных.

Python и его инструменты

Python Programming Track от DataCamp, а также их индивидуальные курсы pandas:

Стиль инструкций DataCamp с тяжелым кодом и среда программирования в браузере отлично подходят для изучения синтаксиса. Их курсы Python имеют средневзвешенный рейтинг 4,64 звезды по 14 отзывам. Введение Udacity в анализ данных, одна из наших рекомендаций для вводных курсов по науке о данных, также касается NumPy и pandas.

R & его инструменты

R Programming Track от DataCamp, а также их индивидуальные курсы dplyr и data.table:

Опять же, стиль инструкций DataCamp с тяжелым кодом и среда программирования в браузере отлично подходят для изучения синтаксиса. Их курс программирования R, который также является одной из наших рекомендаций для курсов программирования в целом, эффективно сочетает в себе основы программирования и инструкции по синтаксису R. Сериал имеет средневзвешенный рейтинг 4,29 звезды по 14 отзывам.

Базы данных и SQL

Введение в базы данных Стэнфордского университета через Stanford OpenEdx (примечание: обзоры устаревшей версии на Coursera)

Во введении Стэнфордского университета в базы данных всесторонне рассматривается теория баз данных, а также представлены несколько инструментов с открытым исходным кодом. Упражнения по программированию - непростая задача. Дженнифер Видом, ныне декан Стэнфордской инженерной школы, говорит ясно и точно. Он имеет средневзвешенный рейтинг 4,61 звезды по 59 отзывам.

Подготовка данных

Импорт и очистка дорожек данных с помощью DataCamp:

Программа DataCamp для импорта и очистки данных (одна на Python и одна на R) отлично подходит для обучения механике подготовки ваших данных для анализа и / или визуализации. На обзорных сайтах, используемых для этого анализа, нет отзывов об этих курсах.

Исследовательский анализ данных

Анализ данных с R от Udacity и Facebook

Анализ данных Udacity с R - это приятное введение в исследовательский анализ данных. Интервью с аналитиками данных Facebook поучительны и вдохновляют. Курс имеет средневзвешенный рейтинг 4,58 звезды по 19 отзывам. Он также служит легким введением к Р.

Большое количество данных

Лучшее практическое применение Hadoop - приручите свои большие данные! от Фрэнка Кейна через Удеми, а затем, если вы хотите больше узнать о конкретных инструментах (все от Фрэнка Кейна через Удеми):

В серии «Большие данные» Фрэнка Кейна рассказывается обо всех самых популярных технологиях, связанных с большими данными, в том числе более 25 в рамках одного только курса «Максимальный». Кейн делится своими знаниями из десятилетнего опыта работы в отрасли с распределенными системами в Amazon и IMDb. В совокупности курсы имеют средневзвешенный рейтинг 4,52 звезды по 6932 отзывам.

Навыки программного обеспечения

Тестирование программного обеспечения от Udacity

Отладка программного обеспечения от Udacity

Контроль версий с Git и GitHub & Collaboration от Udacity (обновления популярного курса Udacity Как использовать Git и GitHub)

Навыки программирования - это часть обучения в области науки о данных, которую часто упускают из виду. Курсы Udacity по тестированию, отладке и контролю версий знакомят с тремя основными темами, актуальными для всех, кто имеет дело с кодом, особенно в командных средах. В совокупности курсы имеют средневзвешенный рейтинг 4,34 звезды по 68 отзывам. У Georgia Tech и Udacity есть новый курс, который охватывает совместное тестирование и отладку программного обеспечения, хотя он более продвинутый и не совсем актуален для специалистов по данным.

Разное

Создание команды по науке о данных Университета Джона Хопкинса через Coursera

Изучение того, как учиться: мощные интеллектуальные инструменты, которые помогут вам овладеть сложными предметами доктора Барбары Окли и Калифорнийского университета в Сан-Диего через Coursera

Сдвиг разума: преодолевать препятствия на пути к обучению и раскрыть свой скрытый потенциал доктора Барбары Окли и Университета Макмастера через Coursera

Подразделение Building a Data Science Team при Университете Джонса Хопкинса дает полезный обзор практики обработки данных. Это очень короткий курс, который можно пройти за несколько часов и пройти аудит бесплатно. Не обращайте внимания на его средневзвешенный рейтинг в 3,41 звезды по 12 отзывам, некоторые из которых, скорее всего, были получены от платежеспособных клиентов.

Курсы доктора Барбары Окли Learning How to Learn и Mindshift сами по себе не являются курсами по науке о данных. Изучение того, как учиться, самый популярный онлайн-курс, охватывает передовые методы, которые, как показали исследования, являются наиболее эффективными для усвоения сложных предметов, включая техники запоминания и работу с прокрастинацией. В Mindshift она демонстрирует, как получить максимальную отдачу от онлайн-обучения и MOOC, как искать наставников и работать с ними, а также секреты того, как избежать карьерных и обычных жизненных проблем. Это два курса, которые должен пройти каждый. У них 4,74-звездочный и 4,87-звездочный средневзвешенный рейтинг по 959 и 407 отзывам соответственно. Оба курса рассчитаны на четыре недели.

Это будущее этого руководства

Это руководство по карьере в области науки о данных будет и дальше обновляться по мере выпуска новых курсов и создания для них оценок и обзоров.

Вы увлечены другой дисциплиной (например, компьютерными науками)? Хотели бы вы помочь миру просвещать? Если вы заинтересованы в создании руководства по карьере, похожего по структуре на этот, напишите нам по адресу [email protected].

Мое будущее

Что касается моего будущего, я рад сообщить, что занял позицию в Udacity в качестве Разработчика контента. Это означает, что я буду создавать и преподавать курсы. Это также означает, что это руководство будет обновлено кем-то другим.

Я присоединяюсь к Udacity, потому что считаю, что у них есть лучшие возможности для создания лучшего образовательного продукта на планете. Из всех курсов, которые я изучал, онлайн или в университете, я лучше всего усвоил, записавшись на нанодиплом. Они включают в себя новейшие достижения в области педагогики и производства, а также отличную систему проверки проектов, оптимистичных инструкторов, здоровых студентов и групп поддержки карьеры. Хотя фрагментарный подход, подобный тому, который мы использовали в этом руководстве, может работать, связная программа с проектами и обзорами во всем гораздо более удобна для студентов.

Обновление Data Analyst Nanodegree - моя первая задача, которая является частью более масштабных усилий по созданию четкого пути Nanodegree для всего, что связано с данными. Вскоре студенты смогут начать с нуля в Udacity с основами работы с данными и, если захотят, пройти весь путь через машинное обучение, искусственный интеллект и даже беспилотные автомобили.

Подведение итогов

Это заключительная часть серии из шести статей, в которой рассматриваются лучшие онлайн-курсы для начала работы в области науки о данных. Мы рассмотрели программирование в первой статье, статистику и вероятность во второй статье, введение в науку о данных в третьей статье, визуализацию данных в четвертой и машинное обучение в пятой.



Здесь мы обобщили пять вышеупомянутых статей и порекомендовали лучшие онлайн-курсы по другим ключевым темам, таким как базы данных, большие данные и даже разработка программного обеспечения.

Если вам нужен полный список онлайн-курсов по науке о данных, вы можете найти их на тематической странице Class Central Наука о данных и большие данные.

Если вам понравилось это читать, ознакомьтесь с некоторыми другими произведениями Class Central:





Если вы нашли это полезным, нажмите 💚, чтобы больше людей увидели его здесь, на Medium.

Это измененная версия моей оригинальной статьи, опубликованной на Class Central, где также представлен простой список курсов, упомянутых здесь.