Путь обучения науке о данных

Если кто-то новичок и хочет начать учиться и освоить науку о данных, я рекомендую 5 мощных советов.

  1. Выберите одного автора и платформу

Я выбрал Эндрю Нг своим Гуру и научился почти всему тому, что знал от него. Когда вы будете следовать за одним автором, вы наверняка сможете настроиться на его образ мыслей и сможете эффективно учиться.

Если кому-то интересно следовать за ним, чтобы изучить машинное обучение, я бы порекомендовал серию, как показано ниже в порядке

  1. ИИ для всех (это предназначено для генеральных директоров, менеджеров, поэтому вы получите представление об ИИ на высоком уровне)
  2. Машинное обучение с помощью Coursera (упражнения выполняются в MATLAB/Octave, но все же хорошо начать с этого и параллельно разрабатывать код на Python для этих упражнений)
  3. Специализация глубокого обучения с Эндрю Нг (это 5 курсов, и очень хорошо изучать глубокое обучение с помощью Python)

Все эти курсы доступны на Coursera, поэтому вы можете придерживаться одной платформы, заплатив ежемесячную плату, и продолжить свое путешествие. Затем вы можете ссылаться на различные материалы, доступные на YouTube и других онлайн-платформах.

2. Выберите один язык программирования и IDE

Python, R, Julia и многие другие языки доступны для вашего путешествия по науке о данных. Но выберите один язык (я предлагаю python) и закончите все свои исследования на python. Тогда его всегда легко закодировать в R. Точно так же выберите одну конкретную IDE, либо блокнот jupyter со Spyder (оба доступны в anaconda), либо аналогичную IDE.

3. Откройте аккаунт GITHUB

Если у вас нет учетной записи GitHub, создайте ее в первый день обучения. Важно хранить все ваши заметки, упражнения и сертификаты в одном месте, и GitHub — хорошее место для хранения всего, и вы всегда сможете вернуться к своему коду позже.

4. Понимание платформ больших данных

Если вы работаете в проекте с большими данными, то это хорошо. Или начните создавать бесплатную учетную запись aws и изучите все облачные функции, поддерживающие разработку больших данных и алгоритмы машинного обучения.

Попробуйте создать простой классификатор, используя лямбда-функцию aws, имея входной файл в S3 и запуская лямбда-файл для создания и сохранения прогнозируемых результатов в S3. Sagemaker является обязательным для понимания.

Изучите другие платформы больших данных, похожие на aws, такие как Azure и т. д.

Вы можете составить список и. Ознакомьтесь со всеми инструментами и технологиями, используемыми в науке о данных.

5. Заинтересоваться

Этот шаг — бесконечное путешествие для специалиста по данным. Наука о данных — это постоянно развивающаяся область. Большая часть исследований и разработок происходит здесь. Поэтому вам должно быть любопытно выучить каждый термин, с которым вы сталкиваетесь в своем путешествии по науке о данных. Проявите любопытство, чтобы узнать статистику, полезную для науки о данных. Проявите любопытство к изучению математики, полезной для науки о данных. Проявите любопытство в творческих навыках презентации, полезных для науки о данных. Заинтересуйтесь изучением R. Заинтересуйтесь изучением новых навыков, связанных с наукой о данных. Думайте о науке о данных :)