Ваша рентабельность инвестиций страдает из-за невозможности нанять должным образом.

Мы нанимаем армии специалистов по анализу данных, когда нам нужны армии аналитиков и инженеров (или разработчиков, или, как вам кажется, вы сами себя идентифицируете).

На данный момент существует колоссальное несоответствие между тем, что хотят получить менеджеры по найму и руководители, и тем, кого они нанимают для выполнения этой работы. По-прежнему существует множество ситуаций, когда специалист по анализу данных является подходящим человеком для работы, но нам нужно лучше понять, что это за ситуации.

В мире очень много данных и мало аналитических данных. Нам нужно больше людей, увлеченных добычей полезных ископаемых и предоставляющих идеи, и меньшее количество людей, занимающихся анализом на уровне поверхности, который не основан на реальной науке. Во многих случаях аналитик, хорошо разбирающийся в бизнесе, может предоставить гораздо больше информации, чем специалист по данным, который новичок в бизнесе. Для многих верно Для роли «Data Science» мы, вероятно, хорошо подходим к специалисту по статистике. Для большинства неправильно обозначенных должностей в области науки о данных, вероятно, лучше обратиться к аналитику или инженеру.

  1. Прекратите нанимать специалистов по анализу данных, когда вам нужен аналитик.
  2. Прекратите нанимать специалистов по анализу данных, когда вам нужен инженер.

Звучит просто! Давайте погрузимся. (Ссылка на дальнейший комментарий)

Прекратите нанимать специалистов по анализу данных, когда вам нужен аналитик.

Я не совсем уверен, каково правильное соотношение аналитиков к ученым в группе данных. Я думаю, это полностью зависит от проблемы, которую вы пытаетесь решить. Что я действительно знаю, так это то, что нанимать 5 специалистов по данным для создания базовых отчетов по базовым показателям бизнеса - это заблуждение.

Есть много хороших статистиков, которые делают отличную работу изо дня в день. Мы действительно никогда больше не слышим об этих людях в мире данных. Многие из действительно хороших специалистов по анализу данных - это на самом деле просто статистики с новым титулом. Другие представляют собой сочетание статистики, инженерии, математики и программирования, которые являются мастером на все руки, но не мастером ни в чем.

Ни для кого не секрет, почему в 2020 году все называют себя специалистами по данным. Представьте, что вы статистик, который изо дня в день делает отличную, честную работу (науку?). Согласно Indeed, Glassdoor и т. Д., Ваша зарплата составляет от 70 до 110 тысяч долларов в год. А затем вы смотрите через плечо и видите, что специалист по анализу данных приносит где-то от 90 до 165 тысяч долларов в год. И в глубине души вы знаете, что у Data Scientist далеко не все статистические данные, которые есть у вас. Может быть, они могут написать немного больше Python, чем вы, или, может быть, немного R, возможно, ничего, что вы не смогли бы подобрать за несколько месяцев ... Может быть, они могут сделать SELECT * FROM Table; и получить некоторые данные, но ничего слишком сложного.

Итак, вы заходите на веб-сайты нескольких компаний, несколько досок по вакансиям, отправляете электронное письмо нескольким друзьям и коллегам, и внезапно вы получаете блестящую новую работу в другой компании, где теперь вы гордитесь тем, что носите титул « Data Scientist ».

Поздравляю! Удобно, что вы также пришли с блестящим дипломом о высшем образовании, своим престижным исследовательским опытом, внезапно ваша зарплата в 95 тысяч долларов в вашей предыдущей компании стала 130 тысяч долларов в вашей новой компании. Ух ты! Какой апгрейд. Затем с вами встречается начальник и назначает вам план работы. Вы тяжело трудитесь и очень быстро понимаете, что ваша повседневная работа превратилась из высококвалифицированной статистики в рабочую нагрузку воина SQL. Внезапно вы тратите 90% своего времени на создание отчетов, доставку баллов PowerPoints и создание панелей мониторинга Power BI для обмена ежедневными пользовательскими метриками. Вы наполовину смеетесь, наполовину плачете, когда понимаете, что теперь выполняете работу аналитика данных начального уровня. 10 лет в аспирантуре и еще 5 в качестве постдока, чтобы потратить свой день на написание нескольких SQL-запросов и поддержку старых информационных панелей.

Это не значит, что вы не цените работу аналитиков. Фактически, вы считаете, что аналитики являются основополагающими для бизнеса, без них мир данных не стал бы вращаться. Если мировые аналитики внезапно перестанут появляться на работе, руководство потеряет рассудок; многие миры превратятся в таблицы Excel из ада. Вы просто знаете, что по своей сути вы статистик и предпочитаете приносить крупную прибыль в конце длительного цикла исследований или небольших разовых консультаций, а не кучу небольших побед изо дня в день или из недели в неделю. как аналитик. Одно не лучше другого; это просто другое мышление.

И снова Data Science потребовала еще одного высококвалифицированного сотрудника и предоставила ему работу аналитика с зарплатой менеджера среднего звена. Эта история не уникальна, и многие люди из разных слоев общества могут узнать об этом опыте.

Этот статистик не только оказался в ситуации выигрыша-проигрыша (выиграл, потому что зарабатывает много денег, проиграл, потому что ненавидел свою работу), но и бизнес оказался в проигрышной ситуации. Компания платит 130 тысяч долларов за должность, которую они могли бы занять с высококвалифицированным аналитиком за 75–100 тысяч долларов. Они также получают более низкое качество работы, потому что статистика просто не заинтересована в ее выполнении. Статистик явно недостаточно квалифицирован для этой работы, но исследования показывают, что высококвалифицированные работники работают хуже, когда их сердце не в работе.

В современном мире аналитик часто бывает достаточно скромным, чтобы не называть себя специалистом по данным. И многие «специалисты по данным» являются аналитиками, достаточно уверенными в себе, чтобы обозначить более престижную должность на своей табличке. Черт возьми, их босс не видит разницы, так почему бы не изменить их титул и не попросить на 40 тысяч долларов больше в год?

Прекратите нанимать специалистов по данным, когда вам нужны инженеры.

Я слышу историю за историей, исходящую от групп данных, которые отражают эту вторую реальность. Многие группы данных лежат в основе создания приложений, которые используют современные модели для создания новых сценариев использования. Представим себе команду данных, которая создает классификатор текста с помощью BERT. Представьте, что это основная функция веб-приложения, которое скоро будет развернуто.

Для меня забавно, как много групповых специалистов собираются в одной комнате для создания такого рода приложений. Что вам явно нужно, так это команда инженеров - может быть, несколько разработчиков фронтенда, несколько специалистов по бэкенду, может быть, один или два инженера машинного обучения, которые работали с этими моделями в прошлом. Последнее, что вам нужно, это группа специалистов по данным, которые бегают вокруг, пытаясь рассказать вам, как работает модель, или спят на столе, пока они ждут возможности запустить проверку модели.

Наверное, не помешает присутствие в комнате одного специалиста по данным. Однако вам, вероятно, не понадобится кто-то со средним уровнем знаний R, прыгающий на каждом шагу. Вам нужен кто-то с действительно отличными статистическими навыками, который может делать действительно большие научные исследования и сохранять честность команды, поскольку они предоставляют рабочее решение. Оставьте написание кода инженерам. Панель мониторинга не обеспечивает масштабных выводов.

Специалисты по обработке данных здесь не для того, чтобы создавать масштабируемые приложения, интерфейсы, создавать конвейер данных или выполнять какие-либо задачи, лежащие в основе создания поставляемого программного обеспечения. Где хороший специалист по анализу данных может помочь, так это в том, чтобы убедиться, что вы выполняете точные научные исследования, убедитесь, что приложение обладает возможностями, необходимыми для получения реальных результатов и т. Д. Они созданы не для того, чтобы писать эффективный код. Они необходимы в одних сценариях и являются помехой в других. Хорошее управление имеет важное значение для делегирования работы и правильного построения этих команд.

В современном мире многим разработчикам и инженерам удобно называть себя специалистами по анализу данных. У них есть бакалавриат по CS и, возможно, даже MS по CS. Их статистика - несколько коротких статей в Википедии или, может быть, курс инженерной статистики. Но им не нужно это понимать, потому что их босс просто хочет приложение, которое работает с использованием существующих технологий и встроенных библиотек статистики. Поэтому они пишут о роли Data Scientist на своей табличке и пытаются получить несколько дополнительных долларов. И они отличные инженеры, поэтому они собираются выпустить действительно отличное программное обеспечение.

Проблема в том, что босс инженера (названный Data Scientist) теперь думает, что им нужно нанять еще 3 Data Scientist, чтобы предоставить больше того же конечного продукта. Внезапно они идут и нанимают действительно хороших специалистов по статистике, которые через 3 месяца понимают, что пытаются выполнять работу инженера со статистикой. Перенесемся немного вперед, и они потеряли интерес, и это беспроигрышный вариант (выигрыш, потому что они получают хорошую зарплату, проигрыш, потому что они ненавидят свою работу) для них и проигрыш для бизнеса.

Звучит знакомо?

Продолжим разговор в Твиттере.

Чтобы поддержать мое письмо и получить доступ ко всем статьям на Medium, посетите https://posey.medium.com/membership