Опишу кратко и пошагово:

  1. Во-первых, вы должны выбрать один язык программирования Python или R. Python предпочтительнее R. А затем потратьте не менее 2 недель (если вы новичок) на изучение основных и важных понятий, таких как типы данных, функции, ООП (объектно-ориентированное программирование), обработка файлов, итераторы и генераторы.
  2. Узнайте о некоторых библиотеках Python, NumPy, Pandas, Matplotlib и Seaborn.
  3. Изучите базовую математику и статистику, некоторые важные темы: матрица, собственное значение, собственные векторы, исчисление, базовая геометрия, среднее значение, медиана, мода, дисперсия и стандартное отклонение, некоторое статистическое распределение и т. д.
  4. Возьмите некоторый набор данных из Kaggle, а затем проанализируйте данные, используя методы Feature Engineering и Exploratory data analysis (EDA).
  5. Изучите процесс сбора данных. Кроме того, изучите SQL, если вы сделали вышеперечисленное.
  6. Начните с алгоритма машинного обучения, а затем с течением времени используйте глубокое обучение (NLP и CV).
  7. Разверните модели машинного обучения.

Бонусные советы:

  1. Сделать хорошую запись в Kaggle.
  2. Создайте репозиторий на GitHub, чтобы продемонстрировать свои навыки.
  3. Создайте хороший профиль на LinkedIn.