И как ты тоже мог

«Вы можете соединить точки только назад, вы не можете сделать это вперед». Стив Джобс

Я получил свою первую работу в области Data Science, не имея степени в области Data Science, и стажировка не имела отношения к этой теме. Оглядываясь назад, я смог проанализировать, что мне помогло. Если вы пытаетесь получить свою первую работу в области Data Science, эта статья может вам помочь.

Конечно, в зависимости от вашей личной ситуации, фона и страны, в которой вы живете, они могут немного отличаться, но вы можете воспользоваться некоторыми советами здесь.

Итак, давайте соединим точки.

Перво-наперво: почему?

Это, вероятно, самая сложная и самая важная часть из всех: почему вы хотите стать специалистом по анализу данных? Я, очевидно, не могу ответить за вас, но вы должны быть уверены, что у вас в голове есть четкий ответ.

Вы знаете, это не самая легкая работа на планете и не самая высокооплачиваемая. Если это просто для того, чтобы следить за ажиотажем, вам, вероятно, следует пересмотреть это.

Это не просто философский вопрос, это то, что действительно может помочь вам подготовиться, если вы готовы на это пойти, что подводит нас к следующему пункту.

Понять работу

Постарайтесь прочитать как можно больше о повседневной работе специалиста по данным. Если над этим работает друг, спросите его, чем он занимается каждый день. Для меня это был один из моих ближайших друзей, который 4 года проработал специалистом по данным в одной из самых известных консалтинговых компаний по данным здесь, во Франции. Он смог дать мне действительно глубокое представление о работе, которую он делает каждый день.



Если у вас нет друга, вы всегда можете связаться со специалистами по данным в Linkedin. Я обнаружил, что большинство людей готовы помочь, если вы об этом попросите. Попробуйте поговорить с людьми из всего спектра рабочих мест (специалисты по обработке данных, инженеры НЛП, инженеры искусственного интеллекта, инженеры машинного обучения, инженеры данных, инженеры компьютерного зрения).

Выбери свои битвы

Если вернуться на 10 лет назад, специалисты по анализу данных делали все. От статистического анализа до НЛП и компьютерного зрения. Теперь, когда технологии становятся более зрелыми и сложными, вы не можете все хорошо изучить.

Поэтому я советую выбрать конкретную ветку данных и сосредоточиться на ней. Это может быть НЛП, компьютерное зрение, временные ряды, MLOps… что угодно. Но избегайте слишком разбросанности, иначе вы в конечном итоге будете знать все только на высоком уровне и не сможете хорошо это продать.

Так что выберите ветку и исследуйте ее глубоко. Понять, о чем идет речь. Какие повседневные функции, используемые модели? Узнайте, что можно из этих моделей, попытайтесь получить их интуитивное представление. И следующий пункт может вам в этом помочь.

Сделай сам

Теперь, когда вы определили предмет, на котором хотите сосредоточиться, я предлагаю вам немедленно начать экспериментировать. Многие люди скажут вам, что у вас должен быть сертификат (например, от Coursera). Хотя я считаю, что это может быть полезно для вас, на самом деле вы просто переходите на другую степень, которая выходит за рамки данной статьи.

Я решительный сторонник философии «учиться на практике». Поэтому я предлагаю вам начать с небольших проектов. Самый очевидный из них - начать с соревнований Kaggle. У вас будут данные и необходимая среда. Начните с соревнований «Детская площадка» или «Приступая к работе», таких как Digit Recognizer для компьютерного зрения или «Титаник» для классификации. Вот что сделал я лично:

  • Скопируйте записную книжку с лучшим рейтингом и попытайтесь понять, что он сделал.
  • Я читал и смотрел видеоролики на YouTube о каждой модели, которую он использовал. Как работает модель и когда ее удобно использовать, постарайтесь получить интуицию. Я проделал то же самое с метриками, которые он использует.
  • Попробуйте сделать свой собственный блокнот на основе того, что я узнал. Начал с очень простых моделей и показателей. Представлять на рассмотрение.

Работа над личными проектами, такими как конкурсы Kaggle, не только поможет вам продвинуться в науке о данных, но и будет добавлена ​​в ваше портфолио при приеме на работу.

Когда я подавал заявку на вакансию в Data Science, я систематически выделял различные соревнования Kaggle, которые я проводил, и то, как я подходил к проблемам.

Подчеркните свой опыт работы с данными

Это самая сложная часть. В своем резюме или на собеседовании вы не должны говорить, что у вас нет опыта в области науки о данных. Позвольте мне объяснить почему.

На нас слишком сильно влияют титулы. Если вы сможете их преодолеть, вы обнаружите, что специалист по данным - это просто ученый, работающий с данными. Каждая модель машинного обучения, наконец, представляет собой набор математических теорий, законов и теперь использует набор библиотек Python.

Теперь, если вы вернетесь к своему прошлому опыту с этим новым глазом, вы обнаружите, что в конце концов занимались наукой о данных в своей жизни. Позвольте мне рассказать вам, как я сам смог продать свой профиль как специалист по анализу данных.

У меня степень магистра компьютерных сетей и докторская степень. в телекоммуникациях. Вот то, что я освоил в конце своей докторской диссертации:

  • Вероятности, некоторые линейные алгебры: это математические основы науки о данных.
  • Математическое моделирование, линейная регрессия, цепи Маркова, математическое моделирование: их можно рассматривать как модели машинного обучения.
  • Графики, такие как линейные графики, диаграммы разброса, гистограммы и другие, которые являются современными методами визуализации данных.
  • Программирование на Python / C ++ / C: наиболее часто используемые языки в Data Science.

Во время собеседования

Поэтому во время собеседований я мог сказать, что у меня нет опыта в области науки о данных, потому что я пришел из совершенно другой области. Вместо этого я решил выделить то, чем я занимался во время своей докторской диссертации. и освоить это близко к тому, что должен знать каждый специалист по данным в наши дни.

Ваше резюме

Вы формулируете свой опыт, используя ключевые слова Data Science. Я лично использовал такие ключевые слова, как математическое моделирование, визуализация данных, обработка данных, построение конвейера. Используйте ключевые слова, которые появляются в сообщении о вакансии. Если они просят Python и sklearn, нет необходимости размещать HTML везде. Если они ищут человека, который создаст продукт с нуля, выделите личные проекты или прошлый опыт, в котором вы смогли это сделать. Вы, наверное, однажды это сделали.

Я также адаптировал свое резюме и настроил его для каждого заявления о приеме на работу. Я редко использую одно и то же резюме для каждого приложения. Я всегда стараюсь настроить его в соответствии с требованиями.

Положение себя

Это то, о чем мы, инженеры и ученые, склонны легко забывать. Основная цель компании - зарабатывать деньги. И он приносит деньги, обеспечивая достаточную ценность для клиента, который готов заплатить часть получаемой стоимости. В зависимости от компании эта ценность может заключаться в продаже серого вещества (например, в консалтинге) или определенного продукта.

Многие компании нанимают специалистов по анализу данных, потому что они думают, что они им нужны, потому что у них много данных и они хотят извлечь из них какую-то ценность или просто следить за текущей шумихой. Какой бы ни была их цель, вы должны четко понимать, чем они занимаются и как специалист по анализу данных может помочь им принести больше пользы, чем та, которую они вкладывают в оплату вам. Вот некоторые вещи, которые вы можете сделать до / во время собеседования:

  • Разберитесь в глобальном бизнесе: продает ли компания обувь, автомобили, книги?
  • Какие данные может иметь эта компания: например, если это компания электронной коммерции, вы можете представить, что данные включают все транзакции на их веб-сайтах, историю посещений клиентов, перечисленные продукты и т. Д.
  • Что бы там делал Data Scientist? помните, что в конце концов компания просто хочет увеличить свои доходы. Если мы возьмем наш пример электронной коммерции, специалист по данным, вероятно, создаст некоторые системы рекомендаций, проанализирует интересы клиентов, почему люди покупают, какие продукты, автоматически классифицирует новые продукты по категориям. Если они проводят кампании Google Рекламы, они, вероятно, хотят иметь возможность максимизировать свое влияние, минимизируя свои ставки (это то, что я действительно имел в интервью для известной компании электронной коммерции).
  • Когда вы поймете все это, подготовьте свои вопросы, чтобы ориентировать собеседование, и приведите интервьюера в эту область, чтобы вы могли рассказать о том, что вы поняли из бизнеса, и о том, как вы могли бы решить эти конкретные проблемы, которые вы уже определили. Конечно, на большинстве собеседований этого делать не нужно, так как интервьюер задаст эти вопросы сам.

Просто подай заявку

Этого никогда не будет сказано достаточно, но лучший способ чему-то научиться - это делать это.

Опять же, я сторонник этой философии. Перед тем, как получить свою первую работу в области данных, я подал заявку на сотни вакансий и получил десятки собеседований в компаниях, работающих в различных отраслях (консалтинг, программное обеспечение, здравоохранение, телекоммуникации и т. Д.). Конечно, вначале мне систематически отказывали. Но я сделал именно то, что делает нейронная сеть, чтобы учиться. Каждый раз, когда мне отказывали, я использовал это, чтобы:

  • Все больше и больше разбираемся в бизнесе.
  • См. Заданные вопросы и смог выявить закономерности.
  • Самое главное, что я отмечал свои слабые стороны из каждого интервью и усиливал их для следующего.

Вы, вероятно, узнаете больше, проведя десять интервью, чем прочитав тысячу книг.

Заключение и совет

Если мы хотим подвести итог, вот шаги, которые необходимо выполнить, чтобы получить первую работу в области Data Science:

  • Убедитесь, что вы знаете, почему вы хотите стать специалистом по данным и что вы действительно этого хотите.
  • Разберитесь, в чем заключается работа специалиста по данным. Прочтите об этом, попросите людей подробно рассказать вам о своей повседневной работе.
  • Примите тот факт, что вы не можете овладеть всем. Выберите область (компьютерное зрение, НЛП,…) и постарайтесь узнать о ней как можно больше.
  • Учитесь на практике, в личных проектах или на конкурсах Kaggle. Это также будет хорошим моментом в вашем портфолио, чтобы показать, что вы знаете, о чем говорите.
  • Забудьте о названиях, сосредоточьтесь на функциях: посмотрите на свой опыт и найдите, где вы делали вещи, связанные с «данными». Выделите их в своем резюме. И покажите, как этот опыт поможет вам как специалисту по анализу данных.
  • Для каждого приложения необходимо понять, каковы потребности компании, зачем им нужен специалист по данным. Докажите, что вы разбираетесь в бизнесе, и покажите, как вы можете принести пользу компании как специалист по данным.
  • Наконец, просто подайте заявку. Вы узнаете больше, чем эта статья, если примените и сделаете собственные выводы.

Хочу особо отметить тот факт, что это выводы из моего личного опыта. Это то, что «я» сделал, чтобы получить свою первую работу Data Scientist. Каждый карьерный путь индивидуален, но вы, вероятно, могли бы воспользоваться некоторыми советами, если хотите добиться успеха в своих следующих заявлениях о приеме на работу.

Получите доступ к экспертному обзору - Подпишитесь на DDI Intel