В январе 2022 года я прошел быстрый процесс поиска работы и имел большой опыт собеседований. Из-за высокого спроса я хотел написать эту статью, чтобы помочь вам в процессе поиска работы и ответить на вопросы сообщества о карьерном пути.

Для тех, кому интересно, прежде чем мы начнем, я хотел бы рассказать вам некоторые подробности о моем опыте работы в качестве специалиста по данным в Deloitte, одной из компаний, известной как «Большая четверка», которую я основал. работаем с в феврале ❤

Я прошел собеседование в более чем 10 компаниях на должность Data Scientist, а также на должности инженера по машинному обучению и инженера по компьютерному зрению. Среди опрошенных мной компаний были также крупные мировые бренды, стартапы и фрилансеры.

Все ли процессы собеседования одинаковы?

По всем собеседованиям, на которых я присутствовал, могу сказать, что процессы отличаются друг от друга, но вопросы и общие запросы схожи.

В то время как некоторые компании начинают с этапа HR/поведения и продолжают с технического собеседования и этапа домашнего задания; некоторые компании начинают с прямого технического собеседования, а затем продолжают собеседование с персоналом. Есть процессы найма, состоящие из 6 этапов, есть также процессы найма, которые заканчиваются в 1 или 2 этапа. Не каждая компания отправляет домашнее задание. Некоторые компании предпочитают писать код в реальном времени, а не отправлять домашнее задание.

Казалось бы, простой вопрос: Можете ли вы рассказать мне немного о себе?

Первый вопрос, который возникал во всех интервью, которые я посещал, был: «Можете ли вы рассказать мне немного о себе». Звучит легко, правда? Могу сказать, что этот вопрос определяет ход всего интервью.

Вопросы для интервью в основном развиваются в зависимости от вашего предыдущего опыта. Чем вы интересуетесь, запускали ли вы проект на эту тему, со сколькими людьми вы работали, какой язык программирования/фреймворк использовали, жив ли сейчас проект и т. д. Это первый этап собеседования.

Другими словами, я могу сказать, что ключевая информация, которую вы предоставляете в той части, где вы описываете себя и то, что вы сделали, может определить другие вопросы.

Я предлагаю вам сделать уверенное введение в части о себе, попытаться объяснить техническими терминами, рассказывая о своих проектах, и объяснить бегло и не путая.

Я видел, что ваше владение предметом, который вы описываете, владение прошлыми проектами и вашей работой важны для создания хорошего впечатления на первом этапе. Я хотел бы отметить и это.

Вопросы технического интервью

В первой части технических вопросов я получил вопросы о технических частях проектов, которые я объяснил в вопросе «Можете ли вы рассказать мне немного о себе» выше. Вы должны быть реалистами в своих проектах, и вы можете быть уверены, что отсюда возникнут вопросы.

Например; Я подал заявку в компанию, которая занимается только структурированными данными, и прошел собеседование на должность Data Scientist. Было задано много вопросов о компьютерном зрении, потому что мои предыдущие проекты были основаны на компьютерном зрении. Даже если бы я не имел дело с Computer Vision там, я уверен, что они просили меня проверить правильность того, что я сказал.

На всех собеседованиях было много вопросов о том, понимаю ли я математику работы или нет. Гораздо больше, чем вопросы, которые я перечислил ниже, были заданы в различных сценариях, от простого к сложному. Поэтому я бы сказал, что вы должны изучить вопросы, которые я перечислил ниже, более подробно. Я перечисляю некоторые примеры вопросов ниже;

  • Почему бы нам не использовать функцию активации Relu в выходном слое?
  • У нас есть такой сценарий, согласно этому сценарию, какую функцию активации вы бы предпочли в выходном слое? Почему?
  • Какие показатели вы использовали в своих проектах?
  • Можете ли вы различить такие показатели, как Precision, Recall и F1 Score, в чем разница? Какие показатели вы бы использовали в сценарии XXX?
  • Что такое отсев? Как влияет на вывод, если отсев всегда применяется к одному и тому же значению?
  • Как изменится наша матрица путаницы, когда мы увеличим порог с 50% до 80%?
  • Вы знаете алгоритмы ML/DL? (Вы не должны знать все алгоритмы в этом разделе, но знание базовых алгоритмов, в частности, приносит дополнительные баллы. Я получил вопросы об алгоритмах, таких как PCA, K-Means, SVM, Decision Tree, XGBoost)
  • Выбор алгоритма оптимизации и логика оптимизации
  • Вы раньше работали с предварительно обученными моделями? Какие из них вы использовали? Как это помогло вашему результату?
  • Что такое трансферное обучение, использовали ли вы его раньше?
  • Что такое аугментация? Какие методы увеличения вы бы использовали в сценарии, где нашей целью является XXX?
  • Какие фреймворки вы использовали? Например, знаете ли вы функции tf.record, tf.data для Tensorflow и как вы их использовали?
  • Что такое нормализация и каковы методы нормализации? Почему мы используем нормализацию?
  • Что такое переобучение-недообучение и когда оно возникает? Как бы вы вмешались? (Эти вопросы иногда приходят напрямую, не говоря о переоснащении-недообучении. Например, их можно задать с такими сценариями, как такой большой успех в данных поезда, но такой большой успех в наборе тестовых данных)
  • Как бы вы разделили набор тестовых и обучающих данных? Зачем нужен проверочный набор данных?
  • Что такое перекрестная проверка?
  • Что такое регуляризация, в чем разница между методами и в каких ситуациях она используется?
  • Рекомендательные системы и вопросы системного сценария

Python, R, SQL и др.

Python — очень важный язык программирования для должностей Data Scientist. Если вы можете читать данные, можете ли вы активно использовать такие библиотеки, как Numpy, Pandas, Scikitlearn, чтобы отвечать на их вопросы и анализировать данные?

Вы можете найти статью, где Здесь я перечислил ресурсы для языка программирования Python.

Чтение, анализ, формирование и предварительная обработка данных очень важны для науки о данных. Вот почему по умолчанию требуется иметь возможность понимать различные данные с помощью языка программирования.

Хотя SQL не спрашивают на каждом собеседовании, время от времени это требуется на должностях Data Science. В науке о данных ваша работа может относиться к SQL, поэтому будьте готовы к вопросам об опыте работы с SQL, которые могут возникнуть на собеседовании.

R — это язык программирования, о котором не спрашивают, потому что у меня нет опыта, но я упоминал его на собеседованиях по науке о данных.

Вы можете найти мою статью здесь, где Я перечисляю ресурсы, которые вы можете использовать для изучения языков программирования и улучшения ваших навыков работы с алгоритмами.

Работа в облаке: Google Cloud, AWS и др.

Облачный опыт был темой, которую я упомянул в своем заявлении, которая также есть в моем резюме и которая, я думаю, позволила мне на несколько шагов опередить меня на собеседованиях.

В исследованиях Data Science большую часть времени работа выполняется в облаке, а не локально, по таким причинам, как плотность данных, сложность модели и стоимость установки. Поэтому важно хорошо уметь работать с ноутбуками, знать продукты Anaconda, а также иметь информацию об услугах, предлагаемых облачными технологиями. В большинстве случаев использование облачных инструментов вместо переписывания проекта значительно снижает затраты. Облачные продукты очень полезны не только с точки зрения оборудования, но и с точки зрения инструментов.

Поэтому участие в собеседованиях по науке о данных со знанием облачных продуктов и опытом, если вы можете, продвинет вас вперед.

Неожиданные вопросы

В интервью также были вопросы по решению проблем. В дополнение к противоположным вопросам с технической стороны, некоторые вопросы измеряют ваши аналитические способности и образ мышления. В таких вопросах очень важно мыслить вслух, не стесняться делать замечания и объяснять сказанное причиной.

  • Сколько семей с детьми в Стамбуле?
  • Сколько литров оливкового масла используется в год в Турция?
  • Если у нас есть 8 мячей и балансировочная доска, и только 1 из них тяжелее, сколькими способами мы можем сбалансировать тяжелый мяч с помощью балансировочной доски?
  • Сколько шампуня потребляется в год в мире?

Я уверен, что вопросы были неожиданными и для вас. Не забывайте, что целью задавания этих вопросов является оценка и анализ различных ситуаций, что является одной из важных компетенций Data Science, и, соответственно, ответ на проблему в каждом вопросе, используя терминологию данных, принесет вам плюсовые баллы.

Например, вопрос о скорости использования шампуня; Сколько раз в неделю вы в среднем принимаете душ и как часто вы используете, сколько литров шампуня может быть хорошим введением. Размышление вслух о деталях и выражение ненормальных и различных ситуаций путем просмотра данных будет иметь положительный эффект, например, люди, которые используют мыло вместо шампуня, люди с длинными волосами моют голову 2–3 раза за один душ, люди, которые нет волос не будет использовать ни один шампунь или вообще не использовать его.

Заключение

Область науки о данных широка, и компании могут задавать разные вопросы, но основные вопросы, основанные на знаниях ML и Python, являются предметом почти каждого интервью.

Не бойтесь заходить на собеседование, подходить к технической стадии. В большинстве случаев вопросы адресованы вам и вашим ответам.

Используя LinkedIn или другие сайты по поиску работы, вы можете проверить запросы компаний, которые открывают объявления Data Scientist, отметить технологии, которые вы не знаете, и подготовиться к собеседованиям, восполнив свои недостатки.

Очень важно быть позитивным, уверенным и хорошо осведомленным о прошлых проектах на собеседовании. Понимание проектов от начала до конца, создание сценариев, их анализ и размышления вслух — вот мои предложения, которые могут положительно повлиять на ход вашего собеседования :)

Я хотел перечислить некоторые примеры вопросов, которые были заданы мне, с некоторыми предложениями о том, как ответить. Надеюсь, ты сделаешь хорошую карьеру.

Я регулярно стараюсь писать рекомендации по ресурсам и технические статьи. Вы можете подписаться на мою учетную запись Medium, если вам понравилась статья, вы можете хлопать в ладоши. Ваши комментарии и взаимодействие со мной сделают меня счастливым.

Если вы хотите получить доступ к моим учетным записям в социальных сетях, связаться со мной и получить информацию о моей работе, я покидаю свой сайт. Вы можете следить за мной и общаться со мной в социальных сетях, особенно в Твиттере. Спасибо!