Я пытался изучать машинное обучение уже несколько месяцев и подумал, что будет лучше, если я поделюсь своим путешествием со всеми, чтобы люди, которые пытаются заняться машинным обучением, могли получить какое-то руководство по ориентироваться в этой огромной области исследования.

Шаг 1. Программирование на Python/R

Изучите немного программирование на Python или R. Если вы знакомы с любым другим языком программирования или имеете опыт использования языков программирования для реализации проектов, то понимание Python/R будет для вас пустяком. В Интернете есть много отличных бесплатных источников, которые сделают вас очень хорошим программистом, если вы усердно и искренне пойдете по курсу и постараетесь тщательно и глубоко понять концепции. Некоторые примеры для Python: PythonProgramming.net (наиболее предпочтительный), Python Institute, Learn Python. Некоторые бесплатные курсы по R: Основы R, R для бизнес-аналитики, Наука о данных с R.

Есть также много удивительных МООК, таких как Python для всех, который является платным сертификатом специализации на Coursera от Мичиганского университета.

В Интернете ведется много споров о Python и R в том смысле, какой язык следует предпочесть. Я чувствую, что вы можете начать с любого, а другой вам будет легко подобрать позже, так как основное внимание уделяется изучению концепций машинного обучения (язык программирования можно подробно изучить на лету).

Шаг 2. Базовые знания статистики (необязательное требование)

Не обязательно знать все в статистике, чтобы начать работу с машинным обучением, но хорошо иметь небольшую базу знаний. В машинном обучении есть много концепций, основанных на статистике, и знание их заранее поможет вам лучше понять уроки и технические концепции в курсах (о которых я расскажу в следующих шагах).

Желательно, чтобы, когда вы начинаете без каких-либо предварительных знаний о статистике, вы должны изучать только те концепции статистики, которые требуются в основных МООК, и изучать их только тогда, когда вы с ними сталкиваетесь. Это связано с тем, что статистика — это обширная область, и вы не будете знать, что изучать в начале, что может привести к тому, что вы потратите свое время на концепции статистики, которые практически не требуются в области машинного обучения.

Но все же, если вы заинтересованы в изучении статистики, то обязательно попробуйте различные бесплатные онлайн-курсы, специально разработанные для начинающих по основам статистики. Некоторые из моих любимых — это видео на YouTube от StatQuest, Khan Academy, которые очень интуитивно понятны и просты для понимания.

Шаг 3. Микрокурсы Kaggle

После того, как вы познакомились с Python/R и немного со статистикой, пришло время познакомиться с концепциями кодирования и машинного обучения и их реализацией. Микрокурсы Kaggle очень полезны и целенаправленны. Вы узнаете, как писать код для реализации предварительной обработки данных, как использовать множество возможностей, предоставляемых некоторыми библиотеками ML/анализа данных, среди прочего. Для начала пройдите курсы Python, Визуализация данных, Панды, Введение в машинное обучение. Эти курсы дадут вам обзор и помогут вам приступить к работе, чтобы применить концепции машинного обучения в реальных проектах.

Шаг 4. Основные курсы по машинному обучению

После всего этого вы можете начать работать над некоторыми простыми проектами машинного обучения на Kaggle, такими как Titanic, House Prices. На этом этапе вы будете хорошо разбираться в основных концепциях машинного обучения и в том, как их реализовать. Теперь вы готовы сделать следующий шаг и погрузиться в область машинного обучения. Приведенные ниже курсы являются лучшими МООК, которые можно продолжить.

  1. Машинное обучение, Эндрю Нг

Этот курс доступен бесплатно на Youtube и Coursera. Если вы хотите получить сертификат по этому курсу после завершения, вы можете купить его после прохождения этого курса на Coursera.

2. Машинное обучение от А до Я. Крилль Еременко (Udemy)

Это платный курс на Udemy. Он научит вас реализовывать модели ML вместе с кодом. Код и данные также предоставлены в разделе ресурсов этого курса, так что у вас есть все необходимое, чтобы идти вперед и играть с данными, кодировать модели машинного обучения и применять свои навыки.

Я надеюсь, что это руководство поможет вам сориентироваться в первые дни работы в области машинного обучения или науки о данных.