Наука о данных | Машинное обучение | Искусственный интеллект

20 лучших бесплатных МООК по Data Science, ML и AI в Интернете.

Вот список лучших бесплатных онлайн-курсов по науке о данных, машинному обучению, глубокому обучению и искусственному интеллекту.

Формальное образование в 21 веке превратилось в выбор, а не в обязательную ступень жизни. С Интернет-бумом и ростом массовых открытых онлайн-курсов (МООК) можно выбрать изучение науки о данных онлайн и избежать бремени студенческих долгов. Статистика показывает, что электронное обучение позволяет студентам усваивать в 5 раз больше материала за каждый час обучения. Преимущества онлайн-обучения безграничны - от аспекта сокращения затрат до гибкого графика и среды.

Демократизация науки о данных

Сейчас 2020 год, и наука о данных демократизирована как никогда. Это означает, что любой человек может заниматься наукой о данных практически без опыта, если ему предоставлены надлежащие инструменты и значительный объем данных. По мере того, как данные пронизывают каждую часть отрасли, обладание навыками специалистов по обработке данных станет обязательным условием, поскольку это порождает рабочую силу, говорящую на языке данных.

Имея это в виду, используя онлайн-курсы, даже начинающий может начать заниматься наукой о данных. Все, что для этого требуется, - это правильно структурированная учебная программа, правильная методология обучения (Ultralearning), мотивация и страсть к упорству и побочным действиям / проектам.

Как изучать науку о данных в Интернете?

Лучшие MOOC + правильная методика обучения + азарт + проекты

Итак, в этой статье я расскажу о лучших МООК, которые БЕСПЛАТНЫ и чрезвычайно важны на вашем пути к изучению данных.

Диаграмма Венна для науки о данных

Междисциплинарная область науки о данных может быть визуализирована с помощью этой печально известной диаграммы Венна Дрю Конвея. С помощью этой диаграммы можно сделать вывод, что наука о данных включает в себя навыки взлома, машинное обучение и многомерную статистику.

Я исключил опыт в предметной области, потому что он зависит от компании, в которой вы работаете, а такие сложные навыки, как коммуникативные навыки, нельзя получить с помощью онлайн-курсов, вам нужно поговорить с людьми в реальной жизни, чтобы сделать это (как бы сложно это ни было ).

20 курсов, перечисленных ниже, будут разделены на 3 сегмента:

1. Data Science
2. Hacking skills
- Python
- R
- SQL
3. Machine Learning & AI
- Basics of ML & AI 
- Deep Learning
- NLP
- Computer Vision

Вместо того, чтобы прокручивать центр занятий или часами фильтровать шум в Интернете, я составил этот список, который содержит курсы, которые я считаю полезными в изучении машинного обучения, искусственного интеллекта, науки о данных и программирования.

Итак, прокрутите вниз и посмотрите список прямо сейчас!

МООК

0. Обучение тому, как учиться

Этот курс обучает вас одному из самых важных навыков в вашей жизни - научиться учиться. Он учит вас приемам и методикам, которые гарантируют, что вы сможете запомнить то, чему вы научились, и поможет вам применить их в реальной жизни. Поскольку обучение тому, как учиться, является важным условием для изучения чего угодно, именно поэтому он указан под номером 0, что означает, что он закладывает основу для всех остальных курсов, представленных ниже.



Наука о данных

1. CS109 Data Science - Harvard

CS109 - это курс, который знакомит с методами для пяти ключевых аспектов расследования:

  • обработка, очистка и выборка данных для получения подходящего набора данных
  • управление данными для быстрого и надежного доступа к большим данным
  • исследовательский анализ данных для генерации гипотез и интуиции
  • прогнозирование на основе статистических методов, таких как регрессия и классификация
  • сообщение результатов посредством визуализации, рассказов и интерпретируемых резюме.

Кроме того, его учат на Python!



2. Изучение данных - Калтех

Для всех энтузиастов данных очень важно иметь глубокое понимание того, как машины могут учиться на данных и способы улучшения процесса. Это вводный курс машинного обучения, который охватывает основы теории, алгоритмов и приложений.

Что вы узнаете:

  • Что такое обучение?
  • Может ли машина учиться?
  • Как это сделать?
  • Как это сделать хорошо?


3. Введение в большие данные - Калифорнийский университет в Сан-Диего

Это эпоха больших данных, и все энтузиасты науки о данных обязаны узнать, что это такое и почему это важно.

Что вы узнаете:

  • Терминология и основные концепции, лежащие в основе проблем, приложений и систем больших данных.
  • Как большие данные могут быть полезны в их бизнесе или карьере.
  • Введение в один из самых распространенных фреймворков, Hadoop


4. Наука о данных - Университет Джона Хопкинса

Вкратце, этот курс научит вас задавать правильные вопросы, управлять наборами данных и создавать визуализации для передачи результатов.

Что вы узнаете:

  • Используйте R для очистки, анализа и визуализации данных.
  • Перейдите по всему конвейеру обработки данных от сбора данных до публикации.
  • Используйте GitHub для управления проектами в области науки о данных.
  • Выполните регрессионный анализ, метод наименьших квадратов и вывод с использованием регрессионных моделей.

В конце концов, у вас будет головной проект, в котором вы примените навыки, полученные при создании реального продукта с использованием реальных данных. Затем это портфолио будет отражать ваши новые достижения в области науки о данных.



Математика

5. Специализация «Математика для машинного обучения» - Имперский колледж Лондона.

Этот курс представляет собой специализацию по математике для машинного обучения, которая охватывает всю необходимую вам математику и помогает вам освежить все концепции и теории, которые вы, возможно, забыли в школе. Самое замечательное, что этот курс научит вас его применению в компьютерных науках, давая вам более интуитивное представление о том, как матрицы и регрессия связаны с машинным обучением и наукой о данных.

Эта специализация разделена на три основных курса:

  1. Линейная алгебра
  2. Многомерное исчисление
  3. Снижение размерности с помощью анализа главных компонентов

По окончании этой специализации вы получите необходимые математические знания, чтобы продолжить свой путь и пройти более продвинутые курсы по машинному обучению.



6. Линейная алгебра - Массачусетский технологический институт

Обучает единственный - профессор Гилберт Стрэнг. Мистер Стрэнг - лучший преподаватель линейной алгебры (мое мнение). Итак, если вы ищете отличный курс линейной алгебры, это он.

Этот курс охватывает теорию матриц и линейную алгебру, уделяя особое внимание темам, полезным в других дисциплинах.



7. Многовариантное исчисление - Массачусетский технологический институт

Многовариантное исчисление - еще одно важное понятие в науке о данных. От простой линейной регрессии до поддержки векторных машин и нейронных сетей - требуются исчисления.

Этот курс охватывает дифференциальное, интегральное и векторное исчисление для функций более чем одной переменной.



8. Вероятность и статистика - Стэнфорд.

Вероятность и статистика - это те основы, которые позволяют творить чудеса науки о данных. Без p-значения, биномиального распределения и всего этого жаргона делать прогнозы на основе данных невозможно.

Что вы узнаете:

  1. Исследовательский анализ данных
  2. Производство данных
  3. Вероятность
  4. Вывод

К сожалению, этот курс закрыт, поэтому ниже я напомню вам напоминание! Или, если вам нужен аналогичный курс Карнеги-Меллона, нажмите здесь.



Навыки взлома

9. Курс Google Python

Бесплатный урок от Google для начинающих. Этот класс в основном состоит из заметок, видео и множества упражнений по кодированию, которые помогут вам начать программирование на Python. Я нашел это полезным и рекомендую всем тем, кто хочет начать изучать Python.



10. Прикладная наука о данных с Python - UMich

5 курсов по этой специализации Мичиганского университета знакомят учащихся с наукой о данных с помощью языка программирования Python. В курсе используются удобные и интуитивно понятные блокноты Jupyter.

5 курсов:

  1. Введение в науку о данных
  2. Прикладные графики, графики и представление данных
  3. Прикладное машинное обучение
  4. Прикладной интеллектуальный анализ текста
  5. Прикладной анализ социальных сетей

Еще один курс Python!



11. Статистика со специализацией R - Университет Дьюка

Эта специализация поможет вам освоить анализ и визуализацию в R, одном из лучших языков программирования в области науки о данных.

Что вы узнаете:

  • создавать воспроизводимые отчеты анализа данных
  • единый характер статистического вывода
  • выполнять частотный и байесовский статистический вывод и моделирование для понимания природных явлений и принятия решений на основе данных
  • сообщать статистические результаты правильно, эффективно и в контексте, не полагаясь на статистический жаргон, критиковать утверждения, основанные на данных, и оценивать решения на основе данных
  • обрабатывайте и визуализируйте данные с помощью пакетов R для анализа данных.


12. SQL для науки о данных - Калифорнийский университет в Дэвисе

SQL - устоявшийся язык для взаимодействия с системами баз данных - является важным инструментом для специалистов по данным для извлечения данных и работы с ними. Этот курс специально разработан для новичков, которые хотят добавить SQL в свой раздел навыков LinkedIn и начать использовать его для сбора данных и возиться с ними. Самое главное, они научатся задавать правильные вопросы и будут давать хорошие ответы, чтобы предоставить ценные сведения для вашей организации.

Что вы узнаете:

  • Создание таблиц и возможность перемещать в них данные
  • Общие операторы и как объединить данные
  • Заявления о случаях и концепции, такие как управление данными и профилирование
  • Обсудите темы о данных и потренируйтесь, используя реальные задания по программированию.
  • Интерпретируйте структуру, значение и взаимосвязи в исходных данных и используйте SQL как профессионал, чтобы сформировать ваши данные для целей целевого анализа.


Машинное обучение и ИИ

13. Ускоренный курс по машинному обучению - Google

Этот ускоренный курс представляет собой руководство для начинающих практиков машинного обучения и включает в себя серию уроков с видеолекциями, практическими примерами и практическими упражнениями. Это один из курсов в рамках инициативы Learn with Google AI, который побуждает всех изучать AI.



14. Элементы ИИ - Хельсинкский университет

Elements of AI - это серия бесплатных онлайн-курсов, созданных Reaktor и Университетом Хельсинки. Это было сделано для того, чтобы побудить всех узнать, что такое ИИ, что можно (и что нельзя) делать с помощью ИИ и как начать создавать методы ИИ. Курсы сочетают теорию с практическими упражнениями и могут быть выполнены в удобном для вас темпе.



15. Машинное обучение - Эндрю Нг

Машинное обучение с Эндрю Нг - один из самых популярных онлайн-курсов в Интернете, в нем есть все. От основ до нейронных сетей и SVM, плюс проект приложения в конце. В этом курсе хорошо то, что Эндрю Нг - невероятный учитель. Плохо то, что этому учат в MATLAB (я бы предпочел Python).



16. Практическое глубокое обучение для кодеров - Fast.ai

Fast.ai - это онлайн-курс, который стоит посетить, если вы хотите бесплатно изучить глубокое обучение. Его рекомендуют все в Интернете, и это, безусловно, ценный ресурс для тех, кто хочет изучить глубокое обучение. В этом курсе используются записные книжки Jupyter для вашего обучения и PyTorch в качестве основного инструмента для программирования глубокого обучения.



17. CS230 Deep Learning - Стэнфорд

Глубокое обучение - один из самых востребованных навыков в искусственном интеллекте. В этом курсе вы изучите основы глубокого обучения, поймете, как создавать нейронные сети, и научитесь руководить успешными проектами машинного обучения. Вы узнаете о сверточных сетях, RNN, LSTM, Adam, Dropout, BatchNorm, инициализации Xavier / He и многом другом.



18. CS224N Обработка естественного языка с глубоким обучением - Стэнфорд

Обработка естественного языка (NLP) - одна из важнейших технологий в век информации и важнейшая часть науки о данных. Применение НЛП повсеместно - в веб-поиске, электронной почте, языковом переводе, чат-ботах и ​​т. Д. В этом курсе студенты получат подробное введение в передовые исследования в области глубокого обучения для НЛП.

Что вы узнаете:

  • Спроектируйте, внедрите и изучите модели нейронных сетей.
  • PyTorch!

Смотрите это на Youtube здесь.



19. CS231n: сверточные нейронные сети для визуального распознавания - Стэнфорд.

Компьютерное зрение стало повсеместным в нашем обществе с приложениями для поиска, распознавания лиц, дронов и, в первую очередь, автомобилей Tesla. Этот курс представляет собой глубокое погружение в детали архитектур глубокого обучения с акцентом на изучение сквозных моделей для этих задач, в частности классификации изображений.

Что вы узнаете:

  • Внедрить, обучить и отладить свои нейронные сети.
  • Получите подробное представление о передовых исследованиях в области компьютерного зрения.

Последнее задание включает обучение сверточной нейронной сети с многомиллионными параметрами и ее применение к самому большому набору данных классификации изображений (ImageNet).

Смотрите это на Youtube здесь.



Дополнительные курсы

План Действий

Изучение Data Science в Интернете иногда может быть трудным, поскольку у вас нет структурированного учебного плана, в котором говорится, что делать. Но вместо того, чтобы смотреть на это так, поймите, что у вас есть свобода построить путь обучения, который вам подходит и может выявить в вас все самое лучшее. Хорошо, что вы можете учиться в те моменты, когда ваш мозг работает с максимальной эффективностью, и отдыхать, когда он менее эффективен. Более того, вы сами решаете, чему учиться, в соответствии со своими интересами и увлечением.

Совет

Несколько советов при обучении в Интернете: всегда делать простые заметки, делать выводы в конце дня или вести блог о том, что вы узнали. Точно так же важно использовать технику Фейнмана для объяснения того, чему вы научились, друзьям и семье, особенно для такого сложного предмета, как наука о данных.

Более того, при изучении алгоритмов машинного обучения и нейронных сетей очень важно изучать их вместе с написанием кода, чтобы вы могли видеть, что изучаете, и лучше понимать обсуждаемую тему. Также хорошо быть частью онлайн-сообществ, таких как Reddit, Discord и т. Д., Чтобы вы могли задавать вопросы и получать отличные ответы от экспертов.

Обобщить:

  1. Ведение заметок / ведение блога
  2. Используйте технику Фейнмана
  3. Код вместе с концепциями (создание нейронной сети с нуля)
  4. Присоединяйтесь к онлайн-сообществам по науке о данных, чтобы задавать вопросы

В заключение приведу цитату Артура В. Чикеринга и Стивена К. Эрманна.

«Студенты многому не учатся, просто сидя на уроках, слушая учителей, запоминая заранее подготовленные задания и выплевывая ответы. Они должны говорить о том, что они изучают, размышлять об этом, связывать это с прошлым опытом и применять в своей повседневной жизни. Они должны сделать то, чему они учатся, частью себя ".

Спасибо за чтение, и я надеюсь, что эта статья оказалась для вас находчивой.

Пожалуйста, оставляйте в комментариях любые другие бесплатные онлайн-курсы по Data Science, которые вы могли бы предложить!

Ознакомьтесь с другими моими статьями здесь!

Инструментарий Data Science - серия вводных в Data Science



Прочтите мою серию статей о науке о данных Ultralearning, в которой содержится множество советов и советов по эффективному обучению.



Как« сверхобучиться науке о данных - часть 1
Это краткое руководство, основанное на книге Ультраобучение , в применении к науке о данных medium.com »



Вот отличные ресурсы для науки о данных!











Контакты

Если вы хотите быть в курсе моих последних статей, подписывайтесь на меня на Medium.

Другие способы связи:

Удачного обучения!