Мнение

Подготовка к собеседованию Top Data Science

Несколько идей, основанных на моем опыте интервьюера

Оглавление

  1. Вступление
  2. Сотрудничество с заинтересованными сторонами
  3. Ключевые показатели эффективности
  4. Культура Fit
  5. Резюме
  6. использованная литература

Вступление

В Интернете можно найти множество руководств по собеседованиям по науке о данных, но лишь немногие подчеркивают важность взаимодействия с коллегами и влияние науки о данных на бизнес, а не сосредоточиваются только на концепциях алгоритмов машинного обучения. Конечно, все эти концепции и навыки являются критически важными, но стоит сосредоточиться и на менее технических аспектах науки о данных. С учетом сказанного ниже я выделю три области практики, которые следует интегрировать в вашу подготовку к собеседованию по науке о данных.

Сотрудничество с заинтересованными сторонами

Часто специалисты по обработке данных будут частью группы людей, работающих над достижением конечной цели для бизнеса, будь то сам продукт или клиенты. Этой концепции сотрудничества с заинтересованными сторонами обычно не преподают в школах или программах обучения науке о данных, и ее трудно применять на практике, если у вас еще не было работы в области науки о данных. Но вы все равно можете повторить основные идеи этой концепции и другими способами.

Во-первых, давайте определим, что такое заинтересованная сторона. По моему опыту, это человек, который поручает вам задачу, и в конечном итоге несет ответственность за запуск модели в производство в отношении утверждения, а не отклонения. Заинтересованным лицом обычно является менеджер по продукту, но на самом деле это может быть кто угодно. Это может быть даже вы, в этом случае некоторые из этих советов может быть полезно еще знать.

Вот 3 действенных способа наладить сотрудничество с заинтересованными сторонами:

  • Объясните науку о данных человеку, не имеющему опыта в области науки о данных
  • Понимать различные типы заинтересованных сторон, с которыми вы можете взаимодействовать
  • Понять влияние науки о данных на бизнес

Сначала я хотел выделить их, чтобы их было легко увидеть и понять. А теперь давайте углубимся в каждую из них.

Для №1 попробуйте объяснить, что такое дерево решений - эта концепция является частью стольких алгоритмов машинного обучения, что, если вы сможете объяснить этот, вы уже приобретете много навыков. Эту концепцию легче понять при визуализации. Вы также можете проанализировать разницу между классификацией и регрессией и привести реальные примеры. Например, классификация групп животных (имена) на основе характеристик или прогнозирование непрерывных числовых продаж на основе прошлых данных.

Что касается №2, как я уже сказал выше, менеджеры по продукту могут быть наиболее распространенной ролью заинтересованных сторон. Я бы сказал, что большинство из них имеют технический опыт и, возможно, также знают SQL. Другими примерами могут быть инженеры-программисты, аналитики данных, руководители или высшее руководство.

Что касается № 3, модели науки о данных, которые вы создаете, могут иметь точность 99%, но если они не влияют на бизнес, например, помогая клиенту или экономя деньги, тогда это действительно бесполезно для реализации. При этом лучше всего понимать общие бизнес-метрики, которые определяют успех, и их обычно называют ключевыми показателями эффективности (KPI), которые я буду обсуждать более подробно позже.

Итак, во время собеседования убедитесь, что вы указали, что у вас была некоторая практика сотрудничества с заинтересованными сторонами, даже если она не связана напрямую с опытом работы, и простым примером может быть разъяснение концепций науки о данных семье или друзьям, предоставление примеров для Интервьюер.

Ключевые показатели эффективности

У алгоритмов анализа данных есть свои собственные показатели успеха, такие как точность, точность, отзыв, MAE, MAPE и RMSE, и это лишь некоторые из них. Однако есть и другие показатели успеха, и это влияние модели науки о данных на бизнес. В конечном итоге это зависит от того, в какую компанию вы подаете заявку, но вы можете применить то же мышление к другим отраслям, когда поймете более важные KPI.

Вот несколько примеров KPI:

  • Доход на покупателя
  • Клик на покупателя
  • Стоимость на клиента
  • Выручка по продукту
  • Ежемесячный доход
  • и так далее…

Самая важная часть этих KPI заключается в том, что ваша модель науки о данных, скорее всего, будет либо увеличивать, либо уменьшать их, и если вы сможете выполнить A / B-тест, чтобы должным образом оценить их эффект, тогда вам будет лучше для собеседования. Эту концепцию анализируют не только специалисты по данным, но и менеджеры по продуктам, аналитики данных и другие.

Культура Fit

Наконец, и, возможно, что-то, что не имеет прямого отношения к науке о данных на поверхности, соответствует культуре. Я по-прежнему считаю, что эта концепция - одна из самых важных частей любого собеседования, и я лично хотел бы видеть соискателя, который не только разбирается в науке о данных, но и может хорошо объяснить это другим, а также поладить с командой. .

Специфика науки о данных - это точность и ошибка. Модели науки о данных могут быть сложными, а их метрики - еще более сложными, и они могут меняться ежедневно, поэтому важно осознавать эту изменчивость и четко формулировать ее для других, а не скрывать ее. В целом, честность - лучшая черта, и специалисты по данным могут выразить это в интервью, показывая, что они действительно знают и чего не знают. Нет ничего плохого в том, чтобы не знать всего. Более похвально, если вы можете сказать кому-то, чего не знаете, а не наоборот.

Вот несколько простых вещей, которые следует учитывать при культуре, подходящей для собеседований по науке о данных:

  • Будьте честны и открыты, когда чего-то не знаете
  • Изучите ценности компании перед собеседованием
  • Изучите своих коллег / компанию, чтобы проявить интерес (если вам интересна компания)

В целом, когда вы идете на собеседование, не забывайте, что вы также проводите собеседование с компанией и специалистом по анализу данных. Вы также должны быть уверены, что вам подходит.

Резюме

Есть бесчисленное множество вещей, которые вы могли бы изучить или подготовить в отношении подготовки к собеседованию по науке о данных. Большая часть этой документации сосредоточена только на технических материалах. Хотя это важно, полезно делать все возможное, практикуя больше навыков межличностного общения и бизнес-концепций и демонстрируя это на собеседовании по науке о данных.

Подводя итог, вот три ключевых концепции, которые следует практиковать или использовать перед следующим собеседованием по науке о данных:

* Stakeholder Collaboration
* Key Performance Indicators
* Culture Fit

Надеюсь, моя статья была вам интересна и полезна. Не стесняйтесь оставлять комментарии ниже, если вы согласны или не согласны с этими советами по подготовке к собеседованию по науке о данных. Почему или почему нет? Какие еще факторы, по вашему мнению, важно отметить при подготовке к собеседованию по анализу данных? Конечно, их можно прояснить еще больше, но я надеюсь, что мне удалось пролить свет на некоторые способы подготовки к собеседованию.

Спасибо за чтение!

Я не связан ни с одной из этих компаний.

Не стесняйтесь проверить мой профиль, Matt Przybyla, и другие статьи, а также подписаться на получение уведомлений по электронной почте для моих блогов, перейдя по ссылке ниже, или нажав на значок подписки вверху экрана рядом со значком подписки, и свяжитесь со мной в LinkedIn, если у вас есть какие-либо вопросы или комментарии.

Ссылка для подписки: https://datascience2.medium.com/subscribe

использованная литература

[1] Фотография Christina @ wocintechchat.com на Unsplash, (2019)

[2] Фото DocuSign на Unsplash, (2021 г.)

[3] Фото Brands & People на Unsplash, (2021 г.)

[4] Фото Яна Шнайдера на Unsplash, (2016)