Как сотрудничают специалисты в области науки о данных?
Роли, рабочие процессы и инструменты в области обработки данных
По мере того как все больше и больше организаций внедряют передовые подходы на основе данных для улучшения принятия решений, все больше и больше групп по обработке и анализу данных все больше работают над массивными наборами данных, конвейерами и более важными решениями и продуктами. Но с учетом того, что рабочие процессы в области обработки данных состоят из нескольких этапов, возникает вопрос: «Сотрудничают ли специалисты в области обработки данных?» Если да, то как именно?
В этой статье исследователи из IBM и MIT представляют результаты крупномасштабного опроса специалистов в области обработки данных в крупной корпорации, в ходе которого изучались способы сотрудничества специалистов в области обработки данных.
Участники опроса и вопросы
Исследователи разработали онлайн-опрос и набрали 183 участника, имеющих опыт работы в командах по анализу данных. Вопросы опроса охватывают пять важнейших ролей в группе специалистов по анализу данных (инженер / аналитик / программист, исследователь / ученый, эксперт в предметной области, менеджер / руководитель и коммуникатор).
Они включают шесть этапов рабочего процесса Data Science. Участников также попросили описать их методы совместной работы по обмену и повторному использованию кода и данных, в том числе их ожидания в отношении своей работы и методов документирования.
Инструменты для совместной работы в области науки о данных
Исследователи также изучили инструменты, которые специалисты по обработке данных используют при совместной работе, и то, как их использование связано с методами совместной работы, такими как документация по кодам и данным, а также представили направления для будущих исследований и разработки инструментов для совместной работы в области науки о данных.
Основные вклады в исследования
- Первый масштабный подробный обзор методов сотрудничества в области науки о данных и первое крупное исследование, в котором представлен ролевой анализ сотрудничества.
- Первое крупномасштабное исследование деятельности в области науки о данных на определенных этапах проектов в области науки о данных.
- Первый анализ совместных инструментов, используемых на разных этапах проектов в области науки о данных.
- Первый масштабный анализ практики документации в data science.
Результаты?
Они выяснили, что специалисты по обработке и анализу данных не только активно сотрудничают, но и выполняют различные роли и работают с различными заинтересованными сторонами на разных этапах рабочего процесса проекта в области науки о данных.
Почему это важно?
Работа углубляет текущее понимание практики сотрудничества между членами группы по анализу данных (например, специалистами по обработке данных и инженерами). Полученные данные также могут помочь в обсуждении последствий и предложении дизайна для будущего сотрудничества групп специалистов по анализу данных и направлений исследований.
Подробнее: Как сотрудничают специалисты в области обработки данных? Роли, рабочие процессы и инструменты