Исследователи данных часто слышат о необходимости «рассказывания историй на основе данных». Но что это значит? Проще говоря, это означает, вопреки тому, что часто говорят, что данные не говорят сами за себя: они требуют, чтобы люди построили о них нарратив, рассказали о них историю.

Рассказывать истории естественно для людей. Эта способность помогает нам понимать окружающий мир. Но слишком часто специалисты по данным могут быть настолько сосредоточены на деталях своего анализа — или настолько помнить о проблемах, которые они преодолели, — что они говорят только об этих аспектах своей работы, забывая рассматривать работу в контексте того, почему она была скорее всего, заказывается в первую очередь: для решения бизнес-проблемы.

Это не тривиально. Специалисты по обработке и анализу данных, которые не могут сообщить о влиянии своей работы на бизнес — как правило, описывая вопрос «И что?» и что теперь?" в дополнение к «Что» — могут обнаружить, что их карьера непреднамеренно ограничена, независимо от того, насколько велики их технические знания. Но создание релевантного, значимого повествования о влиянии их работы на бизнес — это только часть того, что необходимо. Чтобы добиться успеха, специалисты по обработке и анализу данных должны понимать все части своей истории и то, как каждая часть привлекает — или не привлекает — разную аудиторию и заинтересованные стороны, а затем действовать соответствующим образом.

Независимо от того, состоит ли результат науки о данных в основном из какого-либо подробного письма, презентации или чего-то еще — или в случаях, когда создается дискуссия, например, для сопровождения представления модели ML — все они могут извлечь выгоду из имеет определенную структуру повествования. В этой статье я делюсь способами построения сюжетной линии науки о данных на примере структуры повествования из Star Trek и предлагаю способы подхода к написанию того, что может быть самым необходимым и важным, но часто и самым важным. пропущенная часть: исполнительное резюме.

Основа повествования о науке о данных

Подобно тому, как Шекспир написал свои сценические пьесы в пяти действиях, так и история о науке о данных состоит из пяти основных структурных компонентов. Они включают исследование данных, анализ, выводы, выводы и рекомендации. Кроме того, «обертка», дополняющая это ядро ​​и состоящая из введения, приложений и, что особенно важно, резюме, завершает полную сюжетную линию науки о данных.

Я начинаю с основных пяти разделов не только потому, что они занимают центральное место в хорошо изложенной истории науки о данных, но и потому, что они должны быть составлены до введения, приложений и крайне важного резюме. собрать вместе.

Пять основных разделов

Чтобы проиллюстрировать пять основных разделов концепции повествования в науке о данных, я использую типичную сюжетную линию Star Trek. В классическом эпизоде ​​из оригинального сериала «Дьявол во тьме» Энтерпрайз прибывает на горнодобывающую планету Янус VI, чтобы исследовать недавно нарушенное производство ключевого минерала, жизненно важного для населения других миров. По мере развития сериала Кирк, Спок, Маккой и их товарищи по съемочной группе следуют структуре повествования, используемой во многих эпизодах Звездного пути, которая также служит иллюстрацией значимой повествовательной структуры науки о данных.

Во-первых, они изучают данные, представленные им горняками планеты: с тех пор, как они достигли особенно глубокого подземного уровня, часть оборудования была повреждена, а некоторые горняки погибли, остались только обугленные кислотой останки. Некоторые горняки утверждают, что видели «монстра», притаившегося рядом с бойней. Опасаясь за свою жизнь, горняки не хотят возвращаться на уровни, где происходят смерти, что снижает добычу минерала. Кроме того, шахтеры говорят, что в этом районе они обнаружили тысячи сферических конкреций кремния — уникальных по форме и составу, но не представляющих коммерческой ценности, — которые они не встречали больше нигде.

Имея в виду эти точки данных, Кирк и Спок исследуют глубокие туннели в поисках подсказок, которые помогут им анализировать ситуацию. Они подтверждают, что на нижних уровнях происходят смерти, когда там погибает один из членов их экипажа. Они подтверждают наличие кремниевых конкреций, а также замечают, что многие из них были разрушены горняками. Они также отмечают, что недавно в скале на нижних уровнях были прорублены дополнительные туннели, но не горняками. В конечном счете, они сталкиваются с мельком замеченным горняками существом, и после того, как непродолжительное противостояние заканчивается ничьей, Спок устанавливает с ним телепатическую связь, узнавая о ситуации с точки зрения существа — и даже о том, что существо называет себя Ортой, что указывает на интеллект.

Из своего анализа, включая информацию, полученную из телепатического общения Спока, они пришли к следующим выводам:Орта — последний представитель своего рода, разумное существо и прирожденный прокладчик туннелей в глубоких скалах, проложивший большое количество яиц на нижних уровнях — шаровидных кремниевых узелках — и наблюдает за ними. Разъяренная шахтерами, уничтожающими ее потомство, и делающая все возможное, чтобы остановить их, она нападала на горняков, убивала их и уничтожала их оборудование.

Основываясь на этих выводах, Кирк и Спок приходят к своим выводам: если они смогут помешать горнякам уничтожить яйца Орты, убийства прекратятся, и добыча полезных ископаемых может возобновиться. Кроме того, поскольку хорта является естественным роющим норы — и поскольку тысячи ее яиц вот-вот вылупятся — они могли бы достичь соглашения, чтобы горняки использовали туннели, естественным образом проделанные хортами в течение их жизни, в противном случае покидая их. друг друга наедине. Это дало бы горнякам еще больше источников минерала, а также другого ценного сырья, которое было бы слишком трудно достать иначе.

Наконец, основываясь на своих выводах, команда Enterprise дает шахтерам рекомендации: прекратить уничтожение кремниевых конкреций, заключить мир с Ортой, приветствовать ее потомство, когда оно появится, и искать взаимовыгодные отношения, в которых Орта живут в мире, прокладывая туннели через глубины, делая полезные ископаемые более доступными для горняков по пути. Со Споком, выступающим в качестве посредника, шахтеры и Орта приходят к соглашению, а затем Энтерпрайз уходит, а Кирку, Споку, Маккою и другим членам экипажа удается не только возобновить добычу полезных ископаемых, но и увеличивая и расширяя его, защищая и уважая Орту и ее будущее потомство.

Важность полного повествования

А теперь представьте на мгновение, что команда Enterprise сделала то, что делают многие специалисты по данным — остановились на своих выводах или, что еще менее полезно, сосредоточились на том, как они провели анализ, вместо того, чтобы перейти к выводам и рекомендациям. Шахтеры узнают только следующее: 1.) обширное исследование подземной пещеры Кирком и Споком обнаружило существо, прокладывающее туннели в глубоких скалах и недавно мотивированное убийством из-за разрушения ее яиц, и 2.) Спок обладает способностью установить телепатическую связь с существом, имея мужество и силу духа, чтобы физически и мысленно вступить с ним в контакт.

В этом случае существование и мотивация существа, хотя и интересны, дают объяснение тому, что испытали шахтеры, но не более глубокое понимание, которое могло бы привести к тому, что шахтеры должны выбрать направление, чтобы исправить ситуацию. А детали телепатического общения Спока — каким бы значительным ни был личный риск и демонстрация способностей для Спока — майнерам не интересны. Только когда Кирк и Спок объясняют свои выводы (значение своих выводов, а именно свое мнение, основанное на их выводах, появляется возможность для взаимовыгодного сотрудничества) и делают их рекомендации (что, по их мнению, майнеры должны делать на основе своих выводов, а именно прийти к соглашению, которое дает обеим сторонам то, что они хотят), что майнеры могут принять меры для решения проблемы, которую они призвали к Предприятие, чтобы помочь в первую очередь.

То, что работает в качестве повествовательной структуры в Star Trek, также работает и в науке о данных. Можно сказать, что полная сюжетная линия науки о данных требует объяснения не только Что (выводы), но также Итак, что (выводы) и Сейчас. Что (рекомендации). Что касается степени сосредоточенности на Как — деталях самого анализа — хотя он действительно имеет свое место и аудиторию, он не везде и не для всех, как я исследую далее.

Создание оболочки для вашей статьи о науке о данных

Пять основных компонентов, которые я рассмотрел выше и которые имеют решающее значение для полного повествования о науке о данных, могут быть дополнительно расширены за счет добавления введения, приложений и, что наиболее важно, хорошо составленного резюме.

Несмотря на то, что готовый результат по науке о данных, когда он наконец представлен, начинается с краткого изложения, за которым следует введение, эти два раздела не являются частями общего повествования, которые специалист по данным должен создать в первую очередь. Это потому, что пять основных частей повествования о науке о данных уже должны быть построены так, чтобы было что сказать в резюме и введении. На самом деле, резюме должно быть подготовлено в последнюю очередь, как я кратко опишу.

Введение, во многом аналогично тому, как каждый эпизод Звездного пути начинается с голоса за кадром, где Кирк говорит в своем журнале, чтобы подготовить почву для дальнейшего развития сюжета, дает предысторию. о бизнес-проблеме, ситуации или вопросе, которые привели к выполнению работы по науке о данных, а также о том, кто ее заказал, и любых других ключевых заинтересованных сторонах. Он также предоставляет общий обзор разделов, которые следуют за ним, от исследования данных до рекомендаций, не вдаваясь в конкретные детали. (Вместо этого их можно найти в резюме; подробнее об этом см. ниже.)

Приложение, похожее на заключительные титры эпизода Star Trek, — это место для всего, что связано с произведением, но не относится ни к одному из других разделов. Таким образом, это, как правило, не формальная часть результата, а скорее вспомогательный компонент. Таким образом, это необязательно. Это также может быть место для работы или «непройденные дороги», которые связаны с работой по науке о данных, но вне общего повествования.

Резюме

Удачно названное, исполнительное резюме — это буквально то, чем делятся с руководителями и другими лицами, принимающими решения, и я описываю его в последнюю очередь, вдаваясь в некоторые подробности по одной причине: часто это самый сложный раздел структуры повествования на основе данных для написания. Это потому, что он должен извлекать суть ключевой информации, необходимой лицам, принимающим решения, — Что, Итак, что и Что теперь — без в разделе Как.

Многие специалисты по данным спотыкаются здесь, потому что они так долго были сосредоточены на Как — и преодолели на этом пути так много препятствий, которыми они по праву гордятся — что они стремятся продемонстрировать это руководителям и ключевым заинтересованным сторонам их ум, настойчивость и умение добиваться результатов. Таким образом, они фокусируются на Как.

Но если мы остановимся, чтобы рассмотреть точку зрения лица, принимающего решение, мы увидим, как это благое намерение может привести к значительным упущенным возможностям. Лицо, принимающее решения, скорее всего, далеко от науки о данных и, вероятно, не имеет опыта работы с данными. Кроме того, лицо, принимающее решения, вероятно, регулярно слышит от многих разных специалистов по данным о ряде различных проектов. Если эти сообщения в первую очередь касаются процесса — Как — то, что лицо, принимающее решения, не в состоянии оценить (или, возможно, даже понять), и если в этих сообщениях отсутствует то, что лицо, принимающее решения, должно сделать их работу — Что, Итак, что и особенно Что теперь — тогда существует значительный разрыв между что нужно лицу, принимающему решения, и что предоставляет специалист по данным.

Умножьте это на многих специалистов по данным, использующих аналогичный подход, и лицо, принимающее решения, может потерять уверенность в способности науки о данных предоставить практическую помощь в принятии лучших бизнес-решений, а специалисты по данным могут потерять авторитет и влияние на лицо, принимающее решения, которое затем может обратиться за помощью в другое место или даже пересмотреть организационные инвестиции, сделанные в науку о данных.

Как только вы поймете эту динамику, будет проще написать эффективное резюме, и вы легко поймете, почему этот раздел должен быть написан последним, даже если он появляется в начале готового результата. Это резюме, обязательно краткое, как следует из его названия, передает основные моменты не более чем в двух-трех предложениях по каждому выводу (Что), выводам ( Итак, что) и рекомендации (Что теперь делать). Он не включает ссылки на источники данных, исследования или детали методов или процессов самого анализа.

Именно исполнительное резюме в первую очередь представляется лицу, принимающему решения, а все остальные части работы либо четко подчинены, либо включены в приложение для последующего использования, если это необходимо или по запросу.

Таким образом, исполнительное резюме предназначено в первую очередь для того, чтобы помочь лицам, принимающим бизнес-решения, и другим ключевым заинтересованным сторонам выполнить свою работу, а именно решить, следовать ли направлению, рекомендованному специалистом по данным, на основе представленных результатов и выводов. Резюме также может быть полезным для других членов аудитории либо в качестве полезного обзора материала без глубокого погружения в его детали, либо в качестве ссылки на материал после того, как он был представлен.

Другие разделы описательной структуры и ее оболочки — введение, исследование данных, анализ, выводы, заключения, рекомендации и приложения — в своей полноте предназначены в первую очередь для других специалистов по данным, менеджеров по науке о данных, руководителей программ и проектов и других заинтересованных лиц. стороны, которым нужны подробности в этих разделах для выполнения своей работы и продвижения науки о данных как дисциплины.

Понимая различные потребности различных членов аудитории в различных частях результатов и предоставляя соответствующие материалы, специалисты по обработке и анализу данных могут дать этой аудитории то, что им нужно для выполнения своей работы, одновременно способствуя совершенствованию науки о данных.

Для тех, кто хочет завершить аналогию со «Звездным путем», где вписывается краткое изложение? Это похоже на предложение, сделанное руководителям индустрии развлечений после разработки сериала и, возможно, после того, как был выпущен пилотный эпизод, резюмируя то, что понравится зрителям в сериале, чтобы привлечь зрителей и, в конечном итоге, получить доход.

Резюме структуры повествования данных

В следующей таблице приведены части структуры повествования на основе данных:

Заключение

Нетрудно понять, почему специалисты по данным иногда сталкиваются с препятствиями, пытаясь повлиять на бизнес своей работой. Наука о данных сложна, сложна, и ее может быть трудно объяснить неспециалистам. Но это имеет решающее значение для достижения конечного успеха науки о данных, который зависит от влияния на бизнес.

Чтобы достичь этого, ученые данных, которые понимают и включают пять основных частей повествования о науке о данных и три раздела-оболочки (в совокупности, резюме, введение, исследование данных, анализ, выводы, выводы, рекомендации и любые приложения), которые может подготовить эффективное резюме на основе пяти основных компонентов, и кто может представить соответствующие части своей работы нужной аудитории в форме повествования о науке о данных, которое применимо и актуально, будет не только более эффективно сообщать о своей работе, они повысят их способность влиять на лиц, принимающих решения, и ключевых заинтересованных лиц, что приведет к эффективному и долгосрочному влиянию бизнеса на их организации — и попутно добьется большего успеха в карьере.

Кейси Дойл зарегистрирована в LinkedIn.