Наука о данных
Пути обучения науке о данных
Как войти в науку о данных и продвинуться по карьерной лестнице
Эта статья направлена на то, чтобы указать читателю на полезные ресурсы для изучения науки о данных. В то же время не у всех одинаковый опыт, поскольку наука о данных по своей сути является разнообразной областью изучения. Итак, наша цель — представить учебный материал, который будет полезен людям с разным опытом и разным стажем работы, начиная с основ науки о данных и заканчивая более сложными и продвинутыми темами. Кроме того, обучение может иметь разное значение для разных людей. Конкретно, некоторые люди могут просто захотеть получить некоторые практические навыки, которые помогут их карьере или повышению квалификации в определенной технологии или методе. Напротив, некоторые люди могут уже работать в этой области и хотят заполнить пробел в своих фундаментальных знаниях, лежащих в основе подходов к науке о данных. Цель состоит в том, чтобы удовлетворить все вышеперечисленные требования.
На наш взгляд, независимо от опыта, есть 4 основных столпа для изучения науки о данных. То есть:
- Навыки программирования
- Специальные знания в области искусственного интеллекта и машинного обучения (AI & ML)
- Математика и статистика
- Облачные сервисы
В следующих параграфах мы представляем материал, который охватывает каждый из этих столпов для специалистов по данным с разным опытом.
Некоторые платформы, которые мы будем использовать, — это Coursera и Datacamp. К сожалению, это платные платформы, но на Youtube или где-либо еще могут быть аналогичные или эквивалентные бесплатные ресурсы.
Начните здесь — станьте специалистом по данным
Программирование
- Лучшие практики кодирования с помощью Python https://learn.datacamp.com/skill-tracks/coding-best-practices-in-python?version=1
- Написание эффективного кода на Python https://www.datacamp.com/courses/writing-efficient-python-code
- Написание функций на питоне https://www.datacamp.com/courses/writing-functions-in-python
- Программная инженерия для специалистов по данным https://www.datacamp.com/courses/software-engineering-for-data-scientists-in-python
- Разработка пакетов Python https://www.datacamp.com/courses/developing-python-packages
- Объектно-ориентированное программирование на питоне https://www.datacamp.com/courses/object-Oriented-programming-in-python
Искусственный интеллект и машинное обучение
- Курс машинного обучения Эндрю Нг https://www.coursera.org/learn/machine-learning?
- Машинное обучение с использованием древовидных моделей https://learn.datacamp.com/courses/machine-learning-with-tree-based-models-in-python
- Настройка гиперпараметров https://learn.datacamp.com/courses/hyperparameter-tuning-in-python
- Машинное обучение с Python https://www.coursera.org/learn/machine-learning-with-python
Математика и статистика
- Математика для машинного обучения Специализация https://www.coursera.org/specializations/mathematics-machine-learning Книга: https://mml-book.github.io/book/mml-book.pdf
- Статистика с Python https://www.coursera.org/specializations/statistics-with-python
Облачные сервисы
- Вводный курс AWS https://explore.skillbuilder.aws/learn/course/external/view/elearning/5678/introduction-to-aws-machine-learning-services и https://explore.skillbuilder.aws/learn /курс/внешний/просмотр/электронное обучение/1970/введение-в-машинное обучение
- Вводный курс GCP https://cloud.google.com/training/business#cloud-digital-leader-path
- Вводный курс MSFT Azure https://docs.microsoft.com/en-us/learn/paths/az-900-describe-cloud-concepts/
Карьерный путь старшего специалиста по данным
Программирование
- Структурирование проектов машинного обучения https://www.coursera.org/learn/machine-learning-projects?specialization=deep-learning
- Введение в Tensorflow https://www.coursera.org/learn/introduction-tensorflow
- Глубокие нейронные сети с Pytorch https://www.coursera.org/learn/deep-neural-networks-with-pytorch
Искусственный интеллект и машинное обучение
- Сверточная нейронная сеть https://www.coursera.org/learn/convolutional-neural-networks?specialization=deep-learning
- Нейронные сети и глубокое обучение https://www.coursera.org/learn/neural-networks-deep-learning?specialization=deep-learning
Математика и статистика
- Ускоренный курс по причинно-следственным связям https://www.coursera.org/learn/crash-course-in-causality
- Байесовская статистика: от концепции к анализу данных https://www.coursera.org/learn/bayesian-statistics?
- Вероятностные графические модели https://www.coursera.org/specializations/probabilistic-graphical-models
- Байесовские методы машинного обучения https://www.coursera.org/learn/bayesian-methods-in-machine-learning?specialization=aml
Облачные службы
- Специально для AWS ML https://www.coursera.org/learn/aws-machine-learning и «https://explore.skillbuilder.aws/learn/public/learning_plan/view/28/machine-learning-learning- план"
- GCP https://www.coursera.org/specializations/machine-learning-tensorflow-gcp и https://cloud.google.com/training/machinelearning-ai/#data-scientist-learning-path
- MSFT Azure https://docs.microsoft.com/en-us/learn/certifications/azure-data-scientist
Для более специализированных направлений, особенно для старших специалистов по данным, мы рекомендуем следующее:
Компьютерное зрение
- Самоуправляемые автомобили https://www.coursera.org/specializations/self-driving-cars
- Основы компьютерного зрения https://www.coursera.org/learn/computer-vision-basics
- Глубокое обучение в компьютерном зрении https://www.coursera.org/learn/deep-learning-in-computer-vision
Обработка естественного языка
- Стэндфордский курс НЛП: https://www.youtube.com/watch?v=8rXD5-xhemo&list=PLoROMvodv4rOhcuXMZkNm7j3fVwBBY42z
- НЛП с Python https://www.udemy.com/join/login-popup/?next=/course/nlp-natural-language-processing-with-python/learn/lecture/12744537#overview
- Обработка естественного языка https://www.coursera.org/learn/language-processing
Прогнозирование временных рядов
- Временные ряды последовательностей и прогнозы https://www.coursera.org/learn/tensorflow-sequences-time-series-and-prediction
- Практический анализ временных рядов https://www.coursera.org/learn/practical-time-series-analysis
- Анализ временных рядов https://www.youtube.com/watch?v=uBeM1FUk4Ps
- Обнаружение аномалий в таймсериях с помощью Keras https://www.coursera.org/projects/anomaly-detection-time-series-keras
Обучение с подкреплением
- Дэвид Сильвер https://www.youtube.com/watch?v=2pWv7GOvuf0&list=PLqYmG7hTraZDM-OYHWgPebj2MfCFzFObQ
- Специализация обучения с подкреплением https://www.coursera.org/specializations/reinforcement-learning
- Практическое обучение с подкреплением https://www.coursera.org/learn/practical-rl?specialization=aml
Это еще не исчерпывающий список курсов и материалов, но он должен стать хорошим началом для всех, кто вступает в мир науки о данных, или для более опытных специалистов по данным, чтобы освежить свои навыки или даже приобрести новые. Пожалуйста, прокомментируйте любые курсы или материалы, которые помогли вам изучить или повысить квалификацию в области науки о данных.
Понравилась статья? Станьте участником Medium, чтобы продолжать обучение без ограничений. Я получу часть вашего членского взноса, если вы перейдете по следующей ссылке, без каких-либо дополнительных затрат с вашей стороны.
Если вам интересна эта статья, вам также может быть интересно следующее: