Этой осенью я получил приглашения на собеседование на должность специалиста по обработке и анализу данных от 4 разных компаний и все их выполнил. Вот темы, которые я подготовил, или я хотел бы подготовить.

Продолжить

Самая важная часть собеседования – это резюме. Вам нужно знать все детали проекта, который вы делали, и, самое главное, почему это важно. Обычно интервьюер просит вас описать проект за 1–2 минуты. Техника интервью STAR также применима здесь. ЗВЕЗДА означает «Ситуация, Задача, Действие, Результат». Здесь вы можете заменить «Задание» в качестве фона проекта. Никогда не забывайте о результате. Не зацикливайтесь на деталях в этой части.

После краткого вступления интервьюер спросит о деталях, и именно здесь вы продемонстрируете свои технические навыки. Я рекомендовал вам подготовить 15-минутную презентацию для каждого из проектов и убедиться, что вы помните предысторию, сложность проекта, сравнение методов и почему вы выбрали свой путь. Когда им понадобятся подробности, представьте им эту версию.

Поведенческие вопросы

Вопросы о поведении так же важны, как и резюме. Будут вопросы о поведении, когда вы разговариваете с менеджером по найму или когда техническое собеседование закончено, и у вас еще есть время.

Начните готовить свои истории! Вам понадобится как минимум 2-3 истории для каждого проекта, указанного в вашем резюме. И я, когда готовил свое интервью, использовал принципы Amazon Leadership. Есть статьи о возможных вопросах поведения, связанных с этими принципами. Убедитесь, что у вас есть 2–3 истории для каждого принципа. Всего у вас должно получиться около 20 историй.

Когда вы рассказываете свою историю, используйте технику интервью STAR.

Никогда не рассказывайте одну и ту же историю одному и тому же интервьюеру. Старайтесь не повторять ту же историю другим интервьюерам в той же компании.

SQL и Python (клавиша R)

SQL всегда появляется на техническом собеседовании или оценке кода. Перед собеседованием ответьте на все простые и средние вопросы по LeetCode SQL. Есть и другие веб-сайты по кодированию, которые помогут вам улучшить свои навыки кодирования, но я выбираю LeetCode. Если вы слишком нервничаете на собеседовании и все забываете, вспомните оконные функции и присоединяйтесь.

Тест Python может быть несколькими способами. 1. Numpy или простое кодирование: вам может потребоваться вычислить матрицу или написать цикл for (понимание списка лучше). 2. Машинное обучение: вы должны помнить основные реализации некоторых простых алгоритмов машинного обучения, таких как применение линейной регрессии к набору данных. 3. График: создание гистограммы или других графиков. 4. Pandas: если возможно, вы должны отвечать на все вопросы по LeetCode SQL на Python. Это означает, что вы читаете данные в python как фрейм данных, а затем используете Pandas для их решения. Я пишу репозиторий, чтобы показать свои стратегии, и он скоро будет опубликован.

Машинное обучение и глубокое обучение

Вопросы этой темы такие: Объясните KNN. Перечислите все допущения линейной регрессии. Какие показатели вы будете использовать, когда данные несбалансированы. Разница между LSTM и RNN.

Но какие методы чаще всего спрашивают?Существует так много разных методов машинного обучения, что вам следует сосредоточиться на тех, которые указаны в вашем резюме, и на основных: линейная регрессия, логистическая регрессия, KNN, SVM, Случайные леса, бустинг, K-средние, иерархическая кластеризация, PCA и нейронные сети. Не тратьте слишком много времени на глубокое обучение, за исключением случаев, когда вы проходите собеседование на должность, ориентированную на глубокое обучение.

Машинное обучение — это не только моделирование. Предварительная обработка данных, выбор правильного метода (сравнение), тонкая настройка модели, оценка этих методов (метрики) также важны.

Эксперименты (A/B-тестирование и тематическое исследование)

Поскольку вы проходите собеседование на должность специалиста по данным, используйте этот вопрос A/B-теста, чтобы показать им, что вы знаете, как быть специалистом по данным в реальной жизни. Процедура ответа на тематическое исследование обычно выглядит следующим образом: 1. повторите проблему интервьюеру и задайте несколько вопросов, чтобы убедиться, что вы правильно поняли вопрос. 2. определить показатель. Большинство тематических исследований начинаются с расплывчатой ​​цели, и первым шагом является изменение расплывчатой ​​цели на простой показатель.

Шаг 3 и шаг 4 можно изменить. Если вы решили использовать предыдущие данные, чтобы найти некоторые идеи, выберите шаги 3а и 4а. Если вы решили протестировать вмешательство, выберите шаги 3b и 4b. Если вы решите найти идеи на основе предыдущих данных и провести эксперименты, то перепутайте вещи.

3а. Выберите функции, связанные с метрикой, всегда включают как демографические данные, так и данные о поведении. 4а. Выберите модель машинного обучения и объясните, почему вы ее выбрали. Придерживайтесь легкого, например, случайных лесов.

3b.определить образцы в эксперименте. Расскажите интервьюеру, как разделить экспериментальную и контрольную группы. Только случайная выборка или выборка по рынкам? 4б. выберите мощность, уровень значимости, минимальную разницу между тестом и контролем и стандартное отклонение, чтобы определить размеры выборки провести t-критерий.

5. Обсудите потенциальные результаты и ваши предложения.Не забудьте дать положительный и отрицательный результат, а затем дайте свое применимое предложение для компании.

Есть и другие концептуальные вопросы: определение p-значения, доверительный интервал, как выбрать размер выборки, что такое эффект новизны и так далее.

Вышеуказанные пять являются наиболее важными. Если у вас мало времени на подготовку к интервью, подготовьте хотя бы предыдущие пять тем. Нижеследующее зависит от работы.

Статистика

  1. Понятия вероятности и статистики. Еще раз просмотрите свои учебники.
  2. Статистические методы. Например, t-критерий, ANOVA, точный критерий Фишера и так далее.
  3. Временные ряды. Модель ARIMA, РНН.
  4. Причинный вывод. Некоторые позиции вывода нуждаются в этой технике.
  5. Байесовская теория

Структура данных и алгоритм

Многие технические интервью включают эту часть. Меня тестировали один раз, и вопрос был на сложном уровне. Несмотря на то, что я не решил ее, я прошел собеседование. Вероятно, ни один кандидат не может решить эту задачу. Поскольку я недостаточно подготовил эту часть, мне нечего сказать по этой теме.

По совету других подготовьте как можно больше простых и средних вопросов LeetCode. По моим наблюдениям, первые несколько вопросов, связанных с массивами, наиболее популярны.

Другие темы описания работы

Могут быть другие темы, не затронутые в этом блоге, НЛП, система рекомендаций или другие знания в предметной области. Они будут указаны в должностных инструкциях. Знакомство с вакансией и компанией поможет вам лучше подготовиться к собеседованию.

Резюме

Наука о данных — это обширная дисциплина. Никто не может подготовить каждую тему перед интервью. Последние два совета: покажите, что вы приготовили. Даже если вы не знаете ответа на вопрос, покажите интервьюеру, что вы знаете. И не бойтесь. Многие интервьюеры создают напряженную и стрессовую атмосферу. Это не значит, что вы сказали что-то не так или они ожидали чего-то другого. Еще раз покажи им, кто ты и что ты приготовил, и все будет хорошо.