В наш век цифрового слова объем данных растет в геометрической прогрессии. Многонациональные корпорации используют эти данные, чтобы узнать о людях и улучшить качество обслуживания клиентов. Правительства также начинают использовать данные для
разработки политики и принятия решений. Большая часть таких реальных данных находится в неструктурированном формате, и в конечном итоге организациям нужны специалисты по данным для получения информации.
Проблема начала работы в области науки о данных заключается не в нехватке ресурсов, а в их много. Итак, я собрал лучшие ресурсы для изучения науки о данных. Если вы новичок и хотите
стать «настоящим» специалистом по данным, неукоснительно следуйте этому пути обучения.
Шаг 1: математические основы
Вероятность:
1.1 «Введение в вероятность - наука о неопределенности» на edX - отличный курс для изучения таких понятий вероятности, как условная вероятность и распределения вероятностей.
Статистика:
1.2 «Описательная статистика» и «Выводная статистика» от Udacity - это обязательные курсы, чтобы начать работу.
Линейная алгебра:
1.3 «Линейная алгебра»: этот краткий и отличный курс по Khan Academy вооружит вас навыками, необходимыми для науки о данных и машинного обучения.
Шаг 2. Изучите (Python | R) | (Python и R)
Python:
2.1 Начните с «CodeAcademy»
2.2 «Введение в Python для науки о данных» - интерактивного курса, разработанного DataCamp.
2.3 Возьмите уроки Google по Python и решите упражнения (YouTube)
R:
2.4 «Интерактивное введение в язык программирования R» - отличный курс от DataCamp, чтобы дать вам практический опыт в R. Курс включает интерактивные примеры. Вам никогда не будет скучно, изучая R.
Шаг 3: Исследование и визуализация данных:
Python:
3.1 «Прикладное построение графиков, диаграмм и визуализация данных» Мичиганского университета на Coursera.
3.2 «Введение в анализ данных» - отличный курс от Udacity по исследованию данных с помощью Numpy и Pandas.
R
3.3 «Исследовательский анализ данных» - отличный курс Университета Джона Хопкинса на Coursera.
Вам не понадобится никакой другой курс для выполнения визуализации и исследовательской работы в R.
Шаг 4. Машинное обучение
4.1 «Машинное обучение» Эндрю Нг. Подписи не требуются!
Python:
4.2 «Прикладное машинное обучение на питоне» Мичиганского университета на Coursera.
R
4.3 «Машинное обучение» Университета Джона Хопкинса на Coursera.
Шаг 5: Специализация
а) Глубокое обучение
5.1 «Глубокое обучение» от Google atUdacity - это отличный базовый курс по переходу от машинного обучения к глубокому обучению, глубоким нейронным сетям, сверточным нейронным сетям
и глубокому обучению для текстов.
5.2 «fast.ai »Курсы.
б) Текстовый анализ
5.3 «cs224w» Стэнфордского университета.
5.4 «Прикладной анализ текста в Python» Мичиганского университета на Coursera.
в) Анализ социальных сетей
5.5 «Социальные сети» профессора Судхаршана из NPTEL.
5.6 «Прикладной анализ социальных сетей на Python» Мичиганского университета на Coursera.
5.7 «Толпы, сети и рынки» на edX.