Как сотрудничают специалисты в области науки о данных?

Роли, рабочие процессы и инструменты в области обработки данных

По мере того как все больше и больше организаций внедряют передовые подходы на основе данных для улучшения принятия решений, все больше и больше групп по обработке и анализу данных все больше работают над массивными наборами данных, конвейерами и более важными решениями и продуктами. Но с учетом того, что рабочие процессы в области обработки данных состоят из нескольких этапов, возникает вопрос: «Сотрудничают ли специалисты в области обработки данных?» Если да, то как именно?

В этой статье исследователи из IBM и MIT представляют результаты крупномасштабного опроса специалистов в области обработки данных в крупной корпорации, в ходе которого изучались способы сотрудничества специалистов в области обработки данных.

Участники опроса и вопросы

Исследователи разработали онлайн-опрос и набрали 183 участника, имеющих опыт работы в командах по анализу данных. Вопросы опроса охватывают пять важнейших ролей в группе специалистов по анализу данных (инженер / аналитик / программист, исследователь / ученый, эксперт в предметной области, менеджер / руководитель и коммуникатор).

Они включают шесть этапов рабочего процесса Data Science. Участников также попросили описать их методы совместной работы по обмену и повторному использованию кода и данных, в том числе их ожидания в отношении своей работы и методов документирования.

Инструменты для совместной работы в области науки о данных

Исследователи также изучили инструменты, которые специалисты по обработке данных используют при совместной работе, и то, как их использование связано с методами совместной работы, такими как документация по кодам и данным, а также представили направления для будущих исследований и разработки инструментов для совместной работы в области науки о данных.

Основные вклады в исследования

  • Первый масштабный подробный обзор методов сотрудничества в области науки о данных и первое крупное исследование, в котором представлен ролевой анализ сотрудничества.
  • Первое крупномасштабное исследование деятельности в области науки о данных на определенных этапах проектов в области науки о данных.
  • Первый анализ совместных инструментов, используемых на разных этапах проектов в области науки о данных.
  • Первый масштабный анализ практики документации в data science.

Результаты?

Они выяснили, что специалисты по обработке и анализу данных не только активно сотрудничают, но и выполняют различные роли и работают с различными заинтересованными сторонами на разных этапах рабочего процесса проекта в области науки о данных.

Почему это важно?

Работа углубляет текущее понимание практики сотрудничества между членами группы по анализу данных (например, специалистами по обработке данных и инженерами). Полученные данные также могут помочь в обсуждении последствий и предложении дизайна для будущего сотрудничества групп специалистов по анализу данных и направлений исследований.

Подробнее: Как сотрудничают специалисты в области обработки данных? Роли, рабочие процессы и инструменты

Спасибо за то, что читаете, комментируете, делитесь и давайте подключимся в Twitter, LinkedIn и Facebook. Чтобы получать обновления самых последних и интересных научных статей, подпишитесь на нашу еженедельную рассылку. Не забудьте 👏, если вам понравилась эта статья. Ваше здоровье!