3 совета и много ресурсов для подготовки
После того, как я стал специалистом по данным, мои друзья часто спрашивали меня, как начать свою карьеру в Data Science. Здесь я суммирую лучшие советы и лучшие учебные ресурсы, которыми я делился с ними.
Совет 1 — ознакомьтесь с бесплатными ресурсами
Удивительно, но существует множество вводных практических ресурсов для изучения науки о данных с нуля, которые не требуют специальных платежей, например, по подписке. Вот мои рекомендации:
- Kaggle Learn — разработанный как предварительный ресурс для подготовки к Kaggle соревнованиям, теперь он охватывает краткий обзор многих актуальных тем.
- Бесплатные курсы от Udacity — помимо платных наностепеней, полезных для адаптации отраслевого опыта (см. ниже), Udacity предоставляет большое количество бесплатных курсов.
- Бесплатные наборы данных для проектов машинного обучения — есть много общедоступных наборов данных, например, наборы данных Kaggle для вышеупомянутой платформы Kaggle, наборы данных sklearn, доступные для библиотеки Python scikit-learn, или наборы данных из агрегированных ссылок на наборы данных через Облачная платформа Google.
- Необязательно, если вы заметили пробелы в кодировании (например, в Python), я бы рекомендовал использовать практические платформы, у которых также есть бесплатные версии, такие как Codewars и Leetcode.
Совет 2 — используйте самые эффективные платные ресурсы
Помимо бесплатных ресурсов, существует ряд платных (оплачиваемых сразу или по подписке) ресурсов. Вот мои рекомендации:
- Deeplearning.ai содержит ряд актуальных курсов/курсовых специализаций, разработанных Эндрю Нг и его коллегами с 2017 года и размещенных (вместе со многими другими курсами, связанными с наукой о данных) на платформе Coursera, требующей оплаты подписки. для доступа к доступным ресурсам и их практической платформе. На данный момент я закончил 14 специализаций Coursera (а также несколько отдельных курсов), а именно Прикладная наука о данных с помощью Python, Машинное обучение в облаке Google, Глубокое обучение, Инженерия данных, большие данные и машинное обучение. Обучение GCP», Сеть в облаке Google, Архитектура с Google Compute Engine, DeepLearning.AI TensorFlow Developer, TensorFlow: данные и развертывание, Машинное обучение для трейдинга, От данных к аналитике с Google Облако, Расширенное машинное обучение в облаке Google, Обработка естественного языка, ИИ для медицины и Основы AWS, и я могу настоятельно рекомендовать большинство из них (особенно из deeplearning.ai).
- Udacity, помимо ряда бесплатных курсов, содержит ряд так называемых программ Nanodegree. В настоящее время я завершил 5 из них, а именно Инженер машинного обучения, Ученый по данным, Обработка естественного языка, Потоковая передача данных и ИИ для трейдинга Наностепени, и я могу настоятельно рекомендовать их всех (особенно первые два, которые содержат проекты Capstone, близки к реальным отраслевым проектам, поэтому вы можете смело использовать их в качестве соответствующего опыта в своем резюме).
- Сертификаты поставщика облачных услуг: до сих пор я работал с тремя ведущими поставщиками облачных услуг (AWS, Microsoft Azure и Google Cloud Platform) и прошел сертификацию со всеми ними, включая AWS Certified Machine Learning, GCP Professional Data Engineer, GCP Professional Machine Learning Engineer, Azure Data Scientist Associate и Azure Solutions Architect Expert, и я могу настоятельно рекомендовать их все, особенно для поставщика, которого вы ищете.
Совет 3 — готовьтесь к интервью
Последний, но не менее важный шаг. Независимо от того, насколько хороши ваши навыки, обычно требуется несколько раундов разговоров и / или кодирования, чтобы получить предложение о работе от вашей любимой компании. Вот мои рекомендации:
- Широко используйте свою сеть для интересующих вас вакансий/компаний, например, вы можете найти обычного человека, который порекомендует вас менеджерам по найму (или даже познакомиться с менеджерами по найму лично!), или, по крайней мере, вы сможете выяснить более подробную информацию о интересующая Вас должность/компания.
- Подготовьте свое резюме в соответствии с объявлением о вакансии, например, используйте ту же формулировку и подчеркните необходимые навыки, в идеале с цифрами.
- Хорошо подготовьтесь к стандартным вопросам интервью — здесь я настоятельно рекомендую использовать как минимум топ-20 видео (отсортированных по просмотрам) с канала Эксперт компаний на Youtube или использовать такие ресурсы, как leetcode.com, для подготовки к интервью по кодированию для конкретных компаний.
- Сохраняйте спокойствие и профессионализм во время и после процесса найма. Часто это просто игра чисел из-за нескольких благоприятных претендентов с сопоставимыми навыками. В этой ситуации подача заявки на большее количество вакансий просто умножит ваши шансы быть принятым на работу.
Q1: Должен ли я сосредоточиться на «бесплатных» или «платных» ресурсах?
Что ж, ничего в этом мире не дается «бесплатно». Даже если вы не платите наличными, вы все равно «платите» своим временем и энергией, которые можно использовать в другом месте (например, для заработка). Таким образом, критерии принятия решений очень индивидуальны.
Вещи, которые я обычно рассматриваю для нового образовательного ресурса:
- потенциально добавленная стоимость (включая полученные знания и ценность сертификации — примечательно, что обе они ухудшаются с увеличением опыта по мере того, как кривая обучения становится мелкой);
- ожидаемые ресурсы (время, деньги, энергия);
- конкурирующие «проекты» (другие проекты, хобби, семья, друзья и т. д.).
Вопрос 2. Какого поставщика облачных услуг мне следует предпочесть?
Я работал с топ-3 крупных поставщиков облачных услуг (Amazon Web Services, Microsoft Azure и Google Cloud Platform) и имею действующие сертификаты от всех них.
У меня сложилось впечатление, что экосистемы основных поставщиков постепенно сближаются друг с другом, и вокруг всех них внедряются аналогичные продукты (например, их общие платформы машинного обучения, такие как Amazon Sagemaker, Vertex AI от Google и Azure от Microsoft). Студия машинного обучения»).
Вот советы, которые следует учитывать при выборе поставщика для обучения/сертификации:
- выбрать поставщика вашей любимой компании (если есть);
- выберите поставщика из вашего предыдущего опыта (если есть).
Q3: Сколько различных навыков я должен освоить, чтобы меня наняли в качестве Data Scientist?
Многие переменные, которые могут повлиять на ответ, — доступные должностные инструкции для той роли, на которую вы претендуете, предыдущий опыт, наличие и сила других конкурентов, желаемое вознаграждение и т. д.
По моему опыту, уровень ваших конкурентов является наиболее решающим фактором в том, возьмут ли вас на данную должность. Сюда входят не только хард скиллы, о которых мы говорили ранее, но и мягкие скиллы (чем важнее, чем на более высокую роль вы претендуете), и (не всегда!) зарплатные ожидания. Однако догадаться об этом непросто, так как процесс найма стохастический (и уж точно не такой уж прозрачный!), поэтому обычно рассматривают альтернативы.
Например, если доступно описание работы, я бы рассматривал его как основную ссылку. Однако во многих ситуациях должностные инструкции вообще отсутствуют (например, в случае со скрытым рынком труда) или же они слишком общие. В этой ситуации я рекомендую искать альтернативные вакансии на аналогичные должности в нескольких разных местах и обобщать их требования (в качестве альтернативы вы можете посмотреть мое любимое описание уровня в ИТ, хотя и не специфичное для ролей Data Science).
Я надеюсь, что эти результаты могут быть полезны для вас. В случае вопросов/комментариев, не стесняйтесь писать в комментариях ниже или свяжитесь со мной напрямую через LinkedIn или Twitter.
Вы также можете подписаться на мои новые статьи или стать приглашенным участником Medium.