Может ли мой будущий непосредственный руководитель и его менеджер заниматься наукой о данных? Могут ли они программировать, помогать решать проблемы и действительно понимать концепции?

Если ответ «нет» или «немного», то немедленно отказывайтесь от роли. Одним из самых больших источников неудач в качестве специалиста по данным является работа с менеджерами, у которых нет функционального опыта в расширенной аналитике (не в бизнес-аналитике или ИТ, а в практическом решении проблем расширенной аналитики), кодировании (Python или R), разработке проектов или научный метод. На моей последней должности я работал на ветерана ИТ и менеджера по бизнес-аналитике (которого каким-то образом повысили до директора по науке о данных), и это был худший опыт в моей карьере, они не приносили никакой пользы и были токсичными менеджерами, у которых не было понимание науки о данных создало несостоятельную и плохую рабочую среду и результаты.

Примечание. Внимательно прочитайте все описания вакансий. Если в должностных инструкциях указано «раздувание ответственности», НЕ ПРИМЕНЯЙТЕСЬ. Раздувание ответственности очень распространено в компаниях с токсичной культурой, плохо определенными рабочими процессами и нехваткой ресурсов, а также в командах Data Science, где менеджеры ужасно неопытны, некомпетентны или просто потеряны. Вы можете легко определить раздувание ответственности, взглянув на навыки и обязанности в описании вакансии в объявлении о вакансии. Если в обязанности входит построение конвейеров ETL/извлечение спорных данных (работа инженера данных), управление заинтересованными сторонами/графиками времени и т. д. (работа менеджера по проектированию), запуск моделей в производство (работа инженера машинного обучения) или создание информационных панелей (работа разработчика бизнес-аналитики), вы будете знать вы наткнулись на неприятную ситуацию и избегаете ее, как чумы. Вы, скорее всего, будете делать некоторые из этих вещей время от времени, но если они входят в обязанности, указанные в объявлении о вакансии, вы, вероятно, наткнулись на токсичную рабочую группу.

Каков средний уровень отраслевого опыта вашей команды?

Если менеджер по найму говорит, что мы нанимаем кандидатов с опытом менее 5–10 лет (не включая стажировки), или мы нанимаем людей сразу после колледжа, даже с докторской степенью. и кандидаты на степень магистра, а затем отклонить предложение. Неопытные специалисты-практики и члены команды будут вытеснять команду и вытеснять высокоэффективных специалистов из-за отсутствия опыта работы в реальных условиях бизнеса. На моей последней должности я работал с несколькими только что окончившими учебу специалистами по данным, которые имели степень магистра, но очень мало реального опыта, и я могу сказать, что они были одними из самых некомпетентных и разочаровывающих сотрудников, с которыми я когда-либо работал. более 30 лет в отрасли. Мало того, что этим типам членов команды не хватает опыта для эффективного функционирования в сложных бизнес-средах, отсутствие опыта также может сделать их токсичными, корыстными и, как правило, помехой для культуры и команды. Эти привычки не исчезают, они несут их с собой на протяжении всей своей карьеры в результате того, что их слишком рано поставили на позицию DS. Это не означает, что из них не получится хороших аналитиков, но наука о данных больше связана с бизнес-знаниями, чем с другими областями, поэтому опыт в классе — плохая замена реальным рабочим знаниям, полученным за годы работы.

Проводят ли ваши менеджеры по найму собеседования в режиме реального времени?

Живых кодов больше нет. Если они попросят о живом собеседовании по кодированию, откажитесь от предложения. «Живое» кодирование означает, что нанимающая компания не принимает реальность кодирования Data Science, которое может быть вполне приемлемым для работы по разработке программного обеспечения, но никакое кодирование Data Scientist без дополнений браузера и многократно используемых блоков, вырезания и вставки и т. д. Кроме того, с эволюция помощников по кодированию, таких как Codex, кодирование Copilot становится устаревшим навыком.

Каков ожидаемый диапазон вознаграждения вашего специалиста по обработке и анализу данных?

Если ответ менее 150 тысяч долларов в год, отклоните предложение. Специалисты по обработке и анализу данных работают над невероятно сложными задачами, и диапазон результатов должен отражать это. Диапазон вознаграждения должен составлять от 150 до 350 тысяч долларов в зависимости от отрасли и роли.

Каково соотношение специалистов по данным и инженеров по данным и аналитиков?

Отсутствие инженеров данных или аналитиков указывает на то, что компания использует магическое мышление, когда речь идет о науке о данных и ее применении. На каждого Data Scientist должно приходиться 1–2 Data Engineers и Analyst.

Подходит ли роль Remote?

Науке о данных, как и другим важным видам деятельности, часто мешают рабочие обязанности в офисе, шум в офисе, перерывы, время в пути, отсутствие времени с семьей и т. д. Если компания говорит, что гибрид или выезд на место, откажитесь от собеседования.

Каково ожидаемое время разработки и развертывания вашей модели?

Если ответом является нечетное число или исключительно короткие сроки для чего-либо, кроме упрощенных моделей и вопросов аналитики, отклоните предложение. Кроме того, как упоминалось в другом месте, моделирование должно составлять небольшой процент времени специалистов по данным.

К какому отделу относится ваша команда Data Science?

Если ответ IT, бегите в другую сторону.

Какой % роли будет потрачен на моделирование?

Если они скажут что-то выше 30%, отклоните предложение. Наука о данных не является моделированием, и большая часть ценности будет зависеть от деятельности, не связанной с моделированием. Среди начинающих специалистов по данным существует огромное заблуждение, что моделирование является конечным результатом работы специалиста по данным. Это неверно, и если организация пытается сфокусироваться на этом, она настроена на неудачу и не понимает расслоения ролей, машинного обучения. Инженерные концепции и т. д.

Каков результат вашего Data Scientist?

Если менеджер по найму говорит, что это разработка производственной модели, отклоните предложение. Построение производственной модели — это лишь небольшая часть роли Data Science со многими более важными функциями, помимо моделирования производственной среды. Если роль в основном связана с производственным моделированием, то, скорее всего, это роль инженера по машинному обучению, а не роль специалиста по данным, и поэтому менеджер по найму не имеет ни малейшего представления об этой функции, что является серьезным тревожным сигналом.

Как вы обеспечиваете психологическую безопасность и психическое здоровье своих специалистов по данным?

Выгорание и проблемы с психическим здоровьем могут быть распространенной проблемой для специалистов по данным, которые связаны с иерархическими организациями с устаревшими стилями управления и типами управления. Наука о данных — это не ваш типичный рабочий процесс с известными результатами, и он может иметь значительные повороты на протяжении всего рабочего процесса, что требует уникальной рабочей среды и управления.

Используете ли вы асинхронный инструмент для управления коммуникацией и рабочим процессом?

Если вы работаете удаленно, асинхронный инструмент станет основой вашего взаимодействия, ускорит общение и обмен знаниями и информацией. Если у них нет надежного инструмента и они широко его используют, а вместо этого полагаются на встречи, звонки и электронные письма, отклоните предложение.

Каков ваш технический стек? Какие инструменты вы используете?

Для специалистов по данным должны быть лицензии и доступ к инструментам по всему технологическому стеку, включая, помимо прочего, инструмент BI, среды Python, облачную рабочую область и другие инструменты. Если у них их нет, откажитесь от предложения.

Где хранятся ваши данные?

Если они не могут объяснить, где хранятся их данные, отклоните предложение.

Вы бы сказали, что ваша команда склоняется к аналитикам или разработчикам программного обеспечения?

Вообще говоря, отсутствие опыта аналитики и знаний в предметной области — два роковых фактора для практики Data Science. Если они говорят, что наши специалисты по данным тратят свое время на разработку или разработку программного обеспечения, или если все ваши коллеги — бывшие инженеры-программисты, отклоните предложение.

Каковы персонажи в жизненном цикле производства в вашей организации?

Сюда должны входить все необходимые персонажи, дополняющие специалиста по данным, включая данные, производство моделей и т. д. Если они говорят, что мы ожидаем, что наши специалисты по данным будут кодировать и развертывать производственные модели, обрабатывать данные, развивать инфраструктуру и выполнять все задачи» (The Sysipean Ловушка)», затем отклоните предложение.

Сколько встреч в неделю будет посещать эта роль?

Совещания любят люди, не являющиеся техническими специалистами, и они могут утопить специалиста по данным, который, как ожидается, будет создавать продукты, идеи и решения, которые требуют предельного внимания и блокируют время. Кроме того, инструменты синхронного общения (Team, Slack и т. д.) сделали чрезмерные встречи отличительной чертой устаревшей культуры. Если менеджер по найму говорит, что 10–15% вашего времени уходит на встречи, отклоните предложение.

Готовы ли вы работать вне аграрной (8–5) модели рабочего цикла?

Цикл 8–5 часов работы был разработан для сельского хозяйства и фабричной работы и является устаревшей ментальной моделью, особенно когда специалистам по данным нужно работать, когда они находят вдохновение для решения новых проблем, что может быть в любое время. Если они строги к тому, чтобы вы входили в систему, когда это удобно компании или мысленной модели исторического рабочего цикла, и не поддерживают нейроразнообразие, отклоните предложение.

Другие красные флажки, на которые следует обратить внимание:

Непонятки о том, что такое машинное обучение и что такое наука о данных. Есть разница, если они не могут объяснить свое мнение, отклоняют предложение.

Слишком агрессивное применение Agile к науке о данных. У Agile есть свое место, но некоторые аспекты науки о данных делают части методологии Agile непригодными.

Они не рассматривают исследования как часть процесса Data Science.

Они просят кандидата перечислить случайные факты/информацию по памяти. Запоминание — мертвый навык и очень непродуктивный в быстро меняющейся области науки о данных. Поисковые системы лишили людей возможности запоминать информацию, а учитывая широкий спектр информации, необходимой для успеха в науке о данных, запоминание становится невыгодным для этих творческих решателей проблем, от которых часто требуется проводить серьезные исследования и понимать возникающие концепции.

Примечание о компаниях FAANG. Эти часто монополистические технологические компании, как известно, стремятся сделать так, чтобы все соответствовали образу мышления разработчиков программного обеспечения, вы можете увидеть это в их процессах найма. Это часто заставляет их нанимать не тех людей, нанимать программистов для работы в области аналитики и в целом приводит к менее успешному результату для настоящих специалистов по данным.

*эти взгляды основаны на опыте автора, ваш собственный опыт может отличаться

205

2

Еще от А