Так как же стать специалистом по данным? Прежде чем мы ответим на вопрос, кто такой специалист по данным?

Специалист по обработке и анализу данных использует данные, чтобы понимать и объяснять окружающие их явления и помогать организациям принимать более обоснованные решения.

Прохладный. Тогда запишите меня, это звучит просто, не так ли?

Ну, не такой быстрый чемпион. Давайте посмотрим, какие навыки необходимы для роли специалиста по данным начального уровня.

  • Ученая степень в аналитической области (например, наука о данных, информатика, инженерия, прикладная математика, статистика, анализ данных, исследование операций).
  • Глубокое понимание передовых методов интеллектуального анализа данных, курирования, обработки и преобразования данных для создания надежных наборов данных.
  • Глубокое понимание жизненного цикла машинного обучения — разработка функций, обучение, проверка, масштабирование, развертывание, оценка, мониторинг и цикл обратной связи.
  • Опыт анализа сложных проблем и перевода его в аналитический подход.
  • Опыт контролируемого и неконтролируемого машинного обучения, включая классификацию, прогнозирование, обнаружение аномалий, обнаружение закономерностей, интеллектуальный анализ текста с использованием различных методов, таких как деревья решений, анализ временных рядов, алгоритмы пакетирования и повышения, нейронные сети, глубокое обучение.
  • Опыт работы с аналитическими языками программирования, инструментами и библиотеками (предпочтительна экосистема Python, но R будет рассмотрен).
  • Опыт работы с SQL и реляционными базами данных, технологиями больших данных, например. Spark/Hadoop и облачные технологии.
  • Хорошее понимание лучших практик программирования и построение для повторного использования.
  • Сильные коммуникативные навыки, партнерские отношения и умение работать в команде.

Что ж, это одна из сотен вакансий на роль специалиста по данным. И они будут меняться по мере того, как меняется компания или, может быть, меняется проект.

Итак, что именно должен знать начинающий специалист по данным, чтобы его рассматривали для включения в списки вакансий? Позвольте мне перечислить некоторые из основных требований, которые компании действительно ищут, прежде чем рассматривать ваш профиль.

  1. Python/R (подойдет любой).
  2. Основная статистика.
  3. Анализ данных и визуализация
  4. Машинное обучение.
  5. SQL.
  6. Развертывание модели ML.
  7. Коммуникация.

Это самые базовые навыки, которыми должен обладать любой специалист по данным. Теперь вернитесь и прочитайте описание вакансии в этом посте. Или любое описание работы в этом отношении. Вы увидите, что с некоторыми незначительными изменениями компании просят вышеупомянутые основные навыки от будущего специалиста по данным.

Но позвольте мне сказать вам еще одну вещь. Просто пройти курсы и попрактиковаться на их данных вам не поможет. Это ловушка, в которую все попадают и тратят впустую довольно много своего времени. Что вам нужно сделать, это испачкать руки. Возьмите проект, который вы хотели сделать. Подготовьте свои данные. Обработайте свои данные. Подумайте для этого конкретного проекта, какая модель должна быть лучшей. Читайте о последних инновациях и пробуйте, можно ли их применить, а не вашу модель. Узнайте, как развернуть эту модель. Запустите метрики и посмотрите, сделала ли что-нибудь улучшенная модель.

Промойте и повторите.

Начните суетиться на Kaggle и KDNuggets. Читайте блоги, но не отклоняйтесь от пути.

Может быть, вы найдете мою идею неправильной, а чью-то другую — правильной. Это нормально. Важно продолжать учиться и практиковаться, иначе все остальное будет пустой тратой времени.

Желаю вам всего наилучшего в вашем путешествии по науке о данных.

Следующими в серии будут ресурсы для роли науки о данных. Спасибо за прочтение.