В наш век цифрового слова объем данных растет в геометрической прогрессии. Многонациональные корпорации используют эти данные, чтобы узнать о людях и улучшить качество обслуживания клиентов. Правительства также начинают использовать данные для
разработки политики и принятия решений. Большая часть таких реальных данных находится в неструктурированном формате, и в конечном итоге организациям нужны специалисты по данным для получения информации.
Проблема начала работы в области науки о данных заключается не в нехватке ресурсов, а в их много. Итак, я собрал лучшие ресурсы для изучения науки о данных. Если вы новичок и хотите
стать «настоящим» специалистом по данным, неукоснительно следуйте этому пути обучения.

Шаг 1: математические основы

Вероятность:

1.1 «Введение в вероятность - наука о неопределенности» на edX - отличный курс для изучения таких понятий вероятности, как условная вероятность и распределения вероятностей.

Статистика:

1.2 «Описательная статистика» и «Выводная статистика» от Udacity - это обязательные курсы, чтобы начать работу.

Линейная алгебра:

1.3 «Линейная алгебра»: этот краткий и отличный курс по Khan Academy вооружит вас навыками, необходимыми для науки о данных и машинного обучения.

Шаг 2. Изучите (Python | R) | (Python и R)

Python:

2.1 Начните с «CodeAcademy»
2.2 «Введение в Python для науки о данных» - интерактивного курса, разработанного DataCamp.
2.3 Возьмите уроки Google по Python и решите упражнения (YouTube)

R:

2.4 «Интерактивное введение в язык программирования R» - отличный курс от DataCamp, чтобы дать вам практический опыт в R. Курс включает интерактивные примеры. Вам никогда не будет скучно, изучая R.

Шаг 3: Исследование и визуализация данных:

Python:

3.1 «Прикладное построение графиков, диаграмм и визуализация данных» Мичиганского университета на Coursera.
3.2 «Введение в анализ данных» - отличный курс от Udacity по исследованию данных с помощью Numpy и Pandas.

R

3.3 «Исследовательский анализ данных» - отличный курс Университета Джона Хопкинса на Coursera.
Вам не понадобится никакой другой курс для выполнения визуализации и исследовательской работы в R.

Шаг 4. Машинное обучение

4.1 «Машинное обучение» Эндрю Нг. Подписи не требуются!

Python:

4.2 «Прикладное машинное обучение на питоне» Мичиганского университета на Coursera.

R

4.3 «Машинное обучение» Университета Джона Хопкинса на Coursera.

Шаг 5: Специализация

а) Глубокое обучение

5.1 «Глубокое обучение» от Google atUdacity - это отличный базовый курс по переходу от машинного обучения к глубокому обучению, глубоким нейронным сетям, сверточным нейронным сетям
и глубокому обучению для текстов.
5.2 «fast.ai »Курсы.

б) Текстовый анализ

5.3 «cs224w» Стэнфордского университета.

5.4 «Прикладной анализ текста в Python» Мичиганского университета на Coursera.

в) Анализ социальных сетей

5.5 «Социальные сети» профессора Судхаршана из NPTEL.
5.6 «Прикладной анализ социальных сетей на Python» Мичиганского университета на Coursera.
5.7 «Толпы, сети и рынки» на edX.