Хорошая наука о данных: искусство быть скептичным, чтобы оставить место для творчества

Хорошая наука о данных возникает из состояния шаткого баланса между двумя диаметрально противоположными чертами, скептицизмом и творчеством. Если вы упадете слишком далеко к одному полюсу, ваша работа застопорится, парализованная неопределенностью. Слишком далеко в другом направлении, и вы тратите ресурсы в погоне за радугой.

По мере того, как наше общество становится все более зависимым от информации, основанной на данных, люди меняют профессию и возвращаются к учебе, чтобы заняться наукой о данных. Этот приток новых кандидатов и увеличение доступных вакансий создает ситуацию, когда менеджеры по найму не уверены в том, что искать, а новые специалисты по данным не уверены, на чем им следует сосредоточить свое обучение. В то время как база знаний и навыки являются важными показателями, хорошие кандидаты могут учиться на работе, чтобы заполнить пробелы в знаниях, и, что более важно, существует большой разрыв между знанием фактов и способностью их эффективно применять. Мы обнаружили, что лучшей характеристикой врожденного потенциала специалиста по данным является то, как он уравновешивает креативность и скептицизм.

Исследователи данных должны проявлять творческий подход.

Этот момент не должен вызывать удивления, поскольку инновации на протяжении всей истории приводились в движение творческими личностями, способными смотреть на проблемы по-новому и находить решения там, где другие потерпели неудачу. Кроме того, наука о данных имеет тенденцию быть очень неструктурированной и абстрактной; многие компании изо всех сил пытаются применить машинное обучение, потому что процесс перехода от данных к результатам не сразу ясен. Наука о данных — это искусство смотреть на данные, слышать бизнес-цели, а затем представлять все шаги, функции и проверки, необходимые для перехода от данных к успеху. Эти наилучшие планы неизбежно потребуют пересмотра, каждый раз требуя от специалиста по обработке и анализу данных новых идей, планов и моделей. Разработка признаков постоянно требует от исследователей творчески разрабатывать новые представления данных, которые позволяют выявить ключевые идеи и закономерности. Креативность позволяет специалистам по данным ответить: «Ну, что теперь?» при представлении отрицательных результатов и новых данных. Креативность становится еще более важной, когда работаешь изолированно, без какой-либо команды, которая могла бы помочь с мозговым штурмом. Креативность позволяет специалистам по данным не только исследовать несколько возможных решений, но и предвидеть подводные камни и риски каждого из них, тем самым предотвращая дорогостоящие сопутствующие и тупиковые решения.

Для творчества в первую очередь нужен скептицизм

Если творчество — это решение проблемы, то скептицизм — мотивирующий фактор. Вы не сможете решить проблему, если сначала не поймете, что проблема существует; единственный способ внести новшества в свою область — выявить текущие недостатки. Скептически относиться к чужой работе — хорошее начало, но великий специалист по данным должен быть самым критическим и скептичным в отношении своих собственных гипотез, моделей и результатов. Возможно, самый большой риск любого проекта по науке о данных — доверять результатам без тщательного и надежного опроса; существует бесчисленное множество способов получить приемлемую точность модели из совершенно бесполезной модели. Те же самые факторы, ведущие к творчеству, должны естественным образом привести к скептицизму, видя все помехи, противоречивые гипотезы и потенциальные источники ошибок в конвейере и кодовой базе. Доверие — самая большая ловушка современной науки о данных; специалисты по данным должны постоянно спрашивать: «Как меня обманывает этот результат и как я могу это проверить?».

Баланс: творчество — это голубое небо, а скептицизм — это траектория.

По-настоящему великий специалист по данным демонстрирует обе эти черты в балансе. Реальные приложения для науки о данных ограничены временем, деньгами и ограниченной доступностью данных, часто с очень беспорядочными данными. Поэтому инновации требуют творческого решения для преодоления этих проблем, учитывая уникальные ограничения для каждого проекта и набора данных. Решения должны быть инновационными, но также практичными, объяснимыми и лаконичными. Сосредоточение творчества на скептицизме обеспечивает практическое решение, которое решает не только проблему науки о данных, но и проблему его работы в реальном мире.

Свяжитесь с нами.

Обладая опытом в области НЛП, машинного обучения, биоинформатики и видео/голосовой аналитики, а также страстью к передовым наукам о данных, наша команда всегда ищет способы улучшить открытия и ускорить ваш потенциал. Если у вас есть вопрос, связанный с наукой о данных, или вы хотите обсудить свою стратегию ИИ, мы будем рады услышать от вас! Свяжитесь с нами сегодня по адресу [email protected], в Twitter @mercurydatasci или на LinkedIn.