Критический взгляд на гибкие методологии в науке о данных

Введение

Наука о данных становится все более популярной практикой в ​​различных отраслях, побуждая компании интегрировать ее в свою деятельность. Тем не менее, существует реальная обеспокоенность тем, что наука о данных может быть ошибочно отнесена к категории просто еще одной практики разработки программного обеспечения, похожей на традиционные подходы к разработке веб-приложений. За последние годы ажиотаж вокруг Agile распространился по всей технологической отрасли, выходя за рамки веб-разработки.

Вспоминая анекдот, мне однажды рассказали о внедрении Agile в юридическую практику, к большому удивлению причастных к этому адвокатов. Они обнаружили, что применяют методы, совершенно не связанные с их юридической практикой, повседневной работой и реальными потребностями. Возникшие в результате негативная обратная связь и отчуждение были настолько ошеломляющими, что их нельзя игнорировать или недооценивать. Сообщалось, что это воздействие вызвало психические расстройства, как если бы это был эксперимент, проведенный самим доктором Зимбардо[1], известным социальным психологом.

Почему наука о данных часто нацелена на гибкие методологии?

Хотя кодирование действительно играет роль в науке о данных, оно не является основной деятельностью Data Scientist. К сожалению, это различие широко не признается и не понимается людьми за пределами области. По мере того, как организации борются с непониманием того, что на самом деле влечет за собой наука о данных, возникает растущее давление с целью обеспечения согласованности. В динамике небольших групп команды часто расширяются, и ИТ-отдел рассматривает науку о данных как логическую область для расширения, что приводит к идеальному шторму несогласованности.

Чтобы проиллюстрировать это, я однажды с чувством беспокойства стал свидетелем того, как «агилист» называл ученого по данным «разработчиком», а блокнот с моделью — «приложение». Такие замечания подчеркивают глубокое непонимание науки о данных в ИТ-индустрии. Похоже, что некоторые представители отрасли придерживаются универсального подхода, рассматривая исследования в области науки о данных так же, как они подошли бы к проекту разработки веб-приложений. Такой подход кажется архаичным и напоминает…