Я изучал и применял концепции науки о данных от начала до конца за последние два с половиной года. Ниже приведен список ресурсов и MOOC, которые я использовал для изучения. Если вы работаете в быстром темпе, вы можете завершить это за 4 месяца (вкладывая по 3–4 часа каждый день). При прохождении этого курса вам нужно учесть два момента: дисциплина и последовательность. Я рекомендую вам смотреть видео с 1,5x - 2x (попробуйте разные скорости и посмотрите, что вам больше подходит).

Месяц 1 - основы Python и их применение в науке о данных

Неделя 1 - изучение python: есть два учебных ресурса, очень полезных для изучения python для науки о данных. Я рекомендую вам просмотреть оба в указанной ниже последовательности. Https://automatetheboringstuff.com/ https://www.codecademy.com/learn/learn-python

Неделя 2. Эта неделя будет более агрессивной для Python, и вам нужно будет изучить аспекты Python, связанные с наукой о данных. Https://www.edx.org/course/introduction-python-data-science-2 - посмотрите на 1.5x, если вы новичок в Python, потратите время на первые 3 темы (основы, структуры данных, функции и packages), в противном случае напрямую переходите к разделу 4, то есть к Numpy, построению графика с помощью matplotlib и pandas. Этот курс даст вам базовое представление об этих библиотеках и их использовании. Если вы хотите изучить дополнительную часть, вы можете обратиться к книге Криса Албона (https://www.amazon.ca/Machine-Learning-Python-Cookbook- Предварительная обработка / dp / 1491989386 / ref = sr_1_1? Ie = UTF8 & qid = 1546373714 & sr = 8-1 & keywords = chris + albon )

Неделя 3. К этой неделе вы приобрели много знаний, чтобы понять код, представленный в этой серии. код, показанный в этих видео Сираджем, и добавьте его в свой онлайн-профиль на github.

Неделя 4. На этой неделе вы изучите промежуточный курс по нижеприведенному курсу Мичиганского университета https://www.coursera.org/specializations/data-science-python. Предложение для этого курса: восстановить ваш браузер и редактор Python, так что оба они видны на экране одновременно, так что вы можете слушать курс и выполнять кодирование одновременно.

Месяц 2 - Основы математики и их применение в науке о данных.

Весь этот месяц мы находимся на пути к пониманию математики. Разделим в этом месяце 4 основных понятия математики. Линейная алгебра, исчисление, вероятность и статистика. Разделите учебные часы таким образом, чтобы каждый день посещать одну лекцию Математика интеллекта Сираджа (https://www.youtube.com/watch?v=xRJCOz3AfYY&list=PL2-dafEMk2A7mu0bSksCGMJEmeddU_H4D). поездка.

Неделя 1 - курс линейной алгебры Массачусетского технологического института, рекомендую прослушать его 2,5–3 раза. Сначала прослушайте все концепции из видео, а затем запишите их на бумаге (я расскажу об этих концепциях в своем следующем посте). 3blue1brown должен быть в вашем списке подписки, Essence of Linear Algebra (https://www.youtube.com/watch?v=kjBOesZCoqc&index=1&list=PLZHQObOWTQDPD3MizzM2xVFitgF8hE_ab) должен быть вашим следующим курсом, а в выходные дни –5 часов, чтобы закончить за один присест.

Неделя 2. Следующим курсом по исчислению (одно- и многовариантному) станет Essence of Calculus.
https://www.youtube.com/playlist?list= PLZHQObOWTQDMsr9K-rj53DwVRMYO3t5Yr Рассмотрите возможность прохождения этого курса за один или два дня.

Неделя 3 - введение в вероятность, этот курс займет больше недели (используйте оставшуюся неделю расчетов 2) https://courses.edx.org/courses/course-v1:MITx+6.041x_4 + 1T2017 / course / К этому времени вы можете быть разочарованы, но не теряйте самообладания и не подходите ни к какой работе, поскольку вы не достигли того, что требуется для должности инженера по машинному обучению или специалиста по данным.

Неделя 4. Введение в статистику Академии Хана - лучший курс для статистики (https://www.khanacademy.org/math/statistics-probability), но есть и другой хороший курс, который включает вся математика для машинного обучения от Imperial College London от coursera (https://www.coursera.org/learn/pca-machine-learning/lecture/QCWpn/variance-of-higher-dimensional-datasets). Обязательно прочтите Голую статистику Чарльза Уилана до конца этой недели (https://www.amazon.ca/Naked-Statistics-Stripping-Dread-Data/dp/1480590185).

Месяц 3 - Основы машинного обучения и связанные алгоритмы.

В этом месяце вы изучите все алгоритмы машинного обучения.

Неделя 1 - этот курс от Udemy поможет вам понять машинное обучение построчно, он разработан с использованием scikit-learn и Keras (обе лучшие библиотеки для академических кругов) https://www.udemy.com / machinelearning / , вы найдете реализацию как в R, так и в Python, я предлагаю оставить видеоролики R на будущее, поскольку вы уже вложили средства в изучение Python, поэтому в каждом разделе вы можете пропустить половину видеороликов и преуспеть в этом курсе. Кроме того, этот курс содержит лекции по глубокому обучению как отдельную часть парка.

Неделя 2. Возможно, вы не сможете пройти вышеупомянутый курс за неделю, и вам понадобится еще несколько дней, используйте эту неделю вместе с одитингом на хороший курс от EDx (https: //courses.edx .org / course / course-v1: ColumbiaX + DS102X + 2T2018 / course / ) не возвращайтесь к концепции, которую вы уже рассмотрели.

Неделя 3. Теперь кое-что может показаться вам несправедливым, и вы можете подумать, зачем мне повторять тот же курс от другого поставщика. но поверьте мне, поскольку и черные, и белые пешки важны в шахматной игре, поскольку они дополняют друг друга, будучи в противоположной команде, нижеупомянутый курс также дополнит тот, который вы изучили на неделе 2, и вы выучите все недостающие компоненты, которые тоже с использованием TensorFlow. (Https://classroom.udacity.com/courses/ud120). Поверьте, вы можете легко просмотреть этот курс, и вы уже знаете концепции, но порядок прохождения этого курса важен.

Неделя 4. Теперь пришло время применить свои знания к реальной проблеме и составить свое резюме. Примите участие в любом конкурсе kaggle, который включает в себя категоризацию или регрессию, завершите его до конца и представьте свое решение (уверенность, которую вы получите, сделав это, - это то, чего вам не может дать ни одна универсальная степень).

Месяц 4 - Основы глубокого обучения от новичка до продвинутого.

В этом месяце вы будете применять все свои знания, чтобы изучить передовые концепции, принять участие в конкурсах kaggle и начать подавать заявки на вакансии.

Неделя 1. Я снова прошу вас еще раз посетить курс Udemy for AZ Deep Leaning (https://www.udemy.com/deeplearning), не забудьте добавить каждый код в ваш профиль на github по мере того, как вы продолжаете прогрессировать в течение этого месяца.

Неделя 2 и 3. Повторное рассмотрение той же концепции еще раз укрепит ее, и вы никогда ее не забудете, поскольку она будет отпечатана в вашем мозгу. Наностепень глубокого обучения Udacity - такой курс (возьмите его сертификат, который поможет вам найти новые карьерные возможности)

Неделя 4. На этой неделе вы доработаете свои концепции и начнете воплощать в жизнь свои мечты. Рекомендую пройти курс fast.ai (http://course.fast.ai/) и блестящий курс и рассказ от Edx (https://www.edx.org/course/analytics-storytelling- удар-1 ). На самом деле и то, и другое нельзя выполнить за неделю, но постарайтесь завершить как можно скорее.

Заключение: к этому моменту вы изучили достаточно концепций и имеете хороший профиль на github, чтобы продемонстрировать потенциальных рекрутеров. Продолжайте публиковать свои работы на github по мере прохождения курса. Я опубликую подробные концепции в своих следующих публикациях, чтобы вам не приходилось носить с собой свои заметки. Всего наилучшего и продолжайте учиться, пока не умрете.