Эта статья представляет собой расширенную версию моей публикации на kaggle, которая была тепло принята и оценена сообществом специалистов по науке о данных. Я искренне надеюсь, что эти рекомендации будут одинаково полезны для более широкой аудитории, поэтому не стесняйтесь оставлять отзывы и делиться этими принципами со своими друзьями, если вы сочтете их ценными.

Введение

Сегодня я хотел бы поделиться своим личным опытом подготовки к поступлению на должность специалиста по данным, когда я был занят другими своими делами (и в конечном итоге стал старшим специалистом по данным менее чем за два года). Так что этот совет будет наиболее полезным для тех, кто пытается перейти в новую сферу и начать карьеру в DS.

В этой статье я хотел бы сосредоточиться на том, как вам следует подходить к процессу обучения, вместо того, чтобы давать вам список платформ для онлайн-обучения (на эту тему написано много других сообщений), поскольку я считаю, что помимо обучения жизненно важно иметь общие рекомендации. материал.

Я всегда был увлечен приобретением новых навыков, и в конце концов я составил список правил, которых я придерживаюсь, чтобы стать профессионалом в любой области. В этой статье я в первую очередь сосредоточусь на задаче стать специалистом по данным, но этот метод применим к любому другому навыку, который вы хотите развить. Без лишних слов, давайте погрузимся в принципы.

Установите конечную цель

Я не могу не подчеркнуть, насколько важно поставить правильную цель. Он определит, как далеко вы зайдете и увидите ли прогресс. Как взрослый, у вас есть преимущество в обучении с определенной целью, в отличие от детей, которые обязаны ходить в школу. Это означает, что вы можете настроить свое обучение так, чтобы достичь поставленных целей в кратчайшие сроки с минимальными усилиями.

Причины для изучения науки о данных могут быть разными: от изучения новой сферы до получения хорошо оплачиваемой работы. Возможно, вы являетесь менеджером проекта и ваша цель - получить краткое представление о том, из каких этапов обычно состоят проекты машинного обучения, чтобы наладить лучшее общение с вашей командой. Или, может быть, вы являетесь DevOps, и один из ваших проектов включает в себя развертывание модели машинного обучения, и ваша цель - понять размер артефакта модели и форматы файлов, чтобы настроить ресурсоэффективный конвейер. Или, может быть, ваша текущая работа не имеет ничего общего со статистикой или информатикой, и вы никогда не программировали, но вы действительно чувствуете, что это ваше дело, и ваша цель - овладеть всеми соответствующими знаниями. Для достижения этих целей требуются разные стратегии и время, поэтому будьте очень конкретны в том, чего вы действительно хотите.

Чтобы правильно сформулировать свою цель, предлагаю задать себе следующие вопросы:

  1. Как я представляю себе свою идеальную жизнь и какую роль в ней будет играть наука о данных?
  2. Какие возможности я получу после освоения науки о данных?
  3. Что я уже знаю о науке о данных?
  4. Что будет моим индикатором успеха?
  5. Является ли изучение науки о данных моей конечной или промежуточной целью?

Ответы на эти вопросы помогут вам встать на правильный путь в обучении и не тратить время на получение знаний, которые вам вряд ли когда-либо понадобятся.

Сделайте долгосрочный прогресс своим главным приоритетом

Не торопись. Это может показаться нелогичным, но когда вы пытаетесь усвоить как можно больше знаний в кратчайшие сроки, вы рискуете отказаться от них рано или поздно. Нет необходимости тренироваться каждый божий день. Большинству людей очень трудно выработать хорошие повседневные привычки. Вспомните свои предыдущие попытки внести огромные изменения в свою жизнь, включив в нее несколько здоровых повседневных дел. Сколько раз вы оказывались в этом и начинали сдаваться в какой-то момент? Основная причина этого в том, что изменения слишком важны.

То же самое и с развитием новых навыков машинного обучения. Пытаться учиться каждый день - это непросто, поэтому не усложняйте то, что уже не так легко понять. Всегда помните: последовательность важнее, чем количество часов в день.

Лучшей стратегией может быть приблизительная оценка того, сколько времени будут занимать ваши курсы в целом, и, в зависимости от того, сколько у вас свободного времени, установка некоторого приблизительного количества учебных часов в неделю. Затем распределите их на весь период, но никогда не за счет других повседневных дел. Вам следует приспособить свое обучение к повседневной жизни, а не наоборот.

Ваши личные предпочтения очень важны

Если вы новичок в науке о данных, вы легко можете быть поражены количеством тем, которые нужно изучить: линейные модели, ансамбли, глубокое обучение, уменьшение размерности, кластеризация… Список очень длинный. Чтобы не заблудиться, пройдите курс для начинающих, охватывающий как можно больше различных тем, без тщательного изучения каждой области, чтобы получить представление о том, что на самом деле представляет собой DS. В Интернете есть множество источников. Комплексный курс поможет вам понять, что вас больше всего интересует: например, обработка естественного языка или компьютерное зрение. Как только вы нашли свою страсть, сосредоточьтесь на ее овладении. Эта стратегия позволит вам стать профессионалом в более короткие сроки, поскольку вы сконцентрируетесь на одной области знаний.

Попробуйте решить несколько реальных задач

Набор данных Titanic хорош для начинающих, но как только вы приобретете некоторые навыки, выберите что-то более острое. Это также поможет вам составить портфель реальных (!) Проектов, которые очень ценятся работодателями. Таким образом вы продемонстрируете, что у вас есть умение решать проблемы, и вы сможете принести пользу компании.

Это может быть что-то очень простое, но полезное. Например, одним из моих побочных проектов был рекомендатель отелей, построенный с использованием gensim и streamlit, чтобы помочь моей подруге найти отель, отвечающий всем ее требованиям. Заставьте себя проявить творческий подход и развлечься 😃

Отслеживайте свой прогресс

Видеть результат своих усилий, вероятно, является одной из главных движущих сил в любой работе, которую вы делаете. Ничто так не стимулирует вас, как ощущение перехода на новый уровень компетентности. Время от времени решайте похожие проблемы машинного обучения. Например, построив свою первую регрессионную модель на табличных данных, попробуйте построить другую, скажем, через один или два месяца на другом наборе данных. В конце концов, вы начнете видеть, что этапы исследования, обработки и построения моделей данных становятся более автоматическими, а ваш начальный рейтинг в таблице лидеров будет намного выше. Результат должен быть виден. Всегда ищите что-то, что будет отражать ваш прогресс, чтобы побудить себя к дальнейшему росту.

Пачкайте руки

Мое последнее предложение вы слышите буквально от каждого. В начале моей карьеры в DS пару лет назад я совершал ошибку, читая чужие работы и записные книжки, а не писал код сам. Не повторяйте мою ошибку. Хорошая идея - найти несколько наиболее эффективных кагглеров и блокнотов, позаимствовать их идеи и фрагменты и реализовать их в своем коде (материалы на kaggle очень хорошо организованы, и вы можете найти хорошие реализации кода для каждой мыслимой темы науки о данных).

Заключение

Изучение науки о данных - сложная задача, независимо от вашего опыта и вашей конечной цели. Однако это очень похоже на развитие других навыков, поэтому можно легко применить передовые методы обучения. В этой статье я постарался представить универсальные рекомендации, которые помогут вам достичь высоких результатов и достичь ваших конечных целей.

Опыт показал, что сложнее всего стать профессионалом - это быть последовательным в том, что вы делаете. Я надеюсь, что этот совет поможет вам построить лучшую стратегию построения карьеры специалиста по данным - несомненно, это одна из самых крутых вакансий на рынке 😎