Знаете ли вы, почему вы не получаете работу в области Data Science даже после долгих усилий? Вы когда-нибудь думали, что это может быть не связано с вашими техническими, статистическими или программными навыками?

Эти навыки не то, о чем все говорят, но они одинаково важны. Особенно на собеседованиях эти навыки проводят тонкую грань между успехом и неудачей.

Если вы когда-нибудь думали, что вам просто не повезло, потому что вы не добились успеха на собеседовании. Поверьте мне, в большинстве случаев это не связано с удачей, а с незнанием того, что ожидается от специалистов по данным.

Основные нетехнические навыки, которые вам нужны:

  • Поставьте свою компанию на первое место
  • В курсе конечных пользователей
  • Под влиянием потребностей бизнеса

Ставьте свою компанию на первое место, а затем себя

Когда ваш босс хочет, чтобы вы запустили модель машинного обучения, прежде чем составлять список моделей, которые вы хотите обучить. Подумайте о самой простой модели, которую вы можете реализовать.

Реализация здесь просто не означает обучение модели. Но сочетание обучения, развертывания и поддержки модели в производстве.

Модели глубокого обучения или нейронные сети могут дать вам наилучшую точность, но их определенно сложнее развернуть, поддерживать или переобучить. В большинстве случаев вы можете добиться почти таких же результатов в случайном лесу с правильной настройкой параметров по сравнению с CNN.

На собеседовании, если кто-нибудь спросит вас, какую модель вы будете обучать данным. Они ожидают, что вы поднимете этот вопрос, что докажет, что у вас есть опыт работы с реальными сценариями.

Осведомлен о конечных пользователях

Игнорирование конечных пользователей или использования ими модели — очень распространенная ошибка начинающих специалистов по данным. Хотя они являются конечными пользователями, как Data Scientist, вы должны думать о них на самых начальных этапах разработки.

Например, вас попросили построить модель для прогнозирования арендной платы в городе, и прогнозируемые цены будут использоваться вашей командой по работе с клиентами. Тогда очень важно спросить команду клиента, нужны ли им точные прогнозы или просто категории арендной платы.

Эта небольшая информация, которую вы получаете от своих клиентов, очень важна для производительности вашей модели после развертывания.

Например, в данных, которые вы получили, целевая переменная — арендная плата за дом может находиться в диапазоне от 500 до 2000 долларов. Это означает, что любая арендная плата, превышающая 2000 долларов США, может быть записана как 2000 долларов США, другими словами, целевое значение ограничено.

Теперь, в зависимости от требований клиента, вам необходимо внести изменения в данные.

Если клиенту нужно знать только, высока ли арендная плата или меньше, тогда данные, которые вы получили, в порядке. Но если ему нужно знать точное значение даже выше 2000$, тогда данные, которые вы получили, должны быть изменены.

Вы будете удивлены, узнав в реальных сценариях, как 15-минутная встреча с вашим конечным пользователем спасает вашу работу.

Под влиянием потребностей бизнеса

Не стесняйтесь учитывать потребности бизнеса при создании набора тестов. Предположим, что маркетинговая команда (конечные пользователи) сообщила вам, что «возраст домов» является важным атрибутом для прогнозирования арендной платы.

Вы можете убедиться, что при создании набора тестов все категории «возраста домов» распределены равномерно. Если категории недоступны, было бы неплохо создать категории на основе возраста.

Это 3 общих навыка, которыми должен обладать любой стремящийся. Если вы думаете о чем-то еще, пожалуйста, оставьте комментарий.

Если вы ищете работу и пытаетесь создать отличное портфолио, эта статья поможет вам. Иди и проверь это