Уроки клиентского консультирования по науке о данных и машинному обучению

Вычисления и технологии являются центрами ключевых областей, таких как наука о данных, машинное обучение, искусственный интеллект, искусственный интеллект, квантовые системы и т. д. – распространенное мнение, хотя на самом деле все они вышли на первый план в нашей жизни. поскольку они влияют или потенциально влияют на то, как мы думаем, живем и выполняем определенные задачи. Хотя технологии являются краеугольным камнем, который приведет нас к следующему возрождению, они вращаются вокруг чего-то более важного — людей.

Подумайте об этом, ваша наука о данных, модели машинного обучения, написанные на python, R, SAS и т. д. и развернутые на AWS, Azure, GCP и т. д., бесполезны, если люди не могут извлечь из них пользу, и в большинстве случаев люди выигрывают. Не иметь возможности извлекать из них какую-либо ценность, если они не ценят результаты ваших изощренных работ. Заставить других понять тонкости того, что вы сделали, является важной частью работы с клиентом и ipso facto консультирования по науке о данных; Крайне важно убедить заинтересованные стороны и других важных людей, с которыми вы имеете дело, в том, что результаты, полученные с помощью ваших сложных моделей, не являются напрасными усилиями (более модное слово — флокцинаукинигилипификация), а имеют реальную ценность.

К сожалению, этот аспект недооценен и сильно недооценен, как я обнаружил на своем опыте. Большинство специалистов по данным, менеджеров и людей, работающих с клиентами, время от времени терпят неудачу в своем понимании желаемого и полученного. В то время как одна группа считает, что она отвечает за синтез продукта и решений, и ей все равно, как эти результаты сообщаются, другая группа обычно совершает ошибку — неправильно интерпретирует комнату — и предполагает, что все в комнате одинаково хорошо понимают, что обсуждается на собрании. Я не храню дух святее тебя, поскольку я много раз терпел неудачу, особенно в эпоху 2014–2019 годов, но пощечины и крещение огнем научили меня нескольким приемам торговли, которые я храню при себе и ссылаюсь на них. назад, чтобы не попасть в распространенные ловушки и придерживаться конечной цели стабильности, объяснимости и удобства использования.

Большинство этих идей, проектов и обязательств реализуются за большими или маленькими столами в конференц-залах и телефонными звонками; важно и жизненно важно обращать внимание на то, о чем идет речь, на ключевые выводы и ожидания на различных этапах; кроме того, бывают случаи, когда вы будете оратором, распространяющим свои идеи среди публики, отвечая на вопросы или объясняя другим эзотерические концепции. Это время для вас, чтобы люди посещали, понимали и, в конечном итоге, убеждали своими идеями.

Следующие практики были частью того, что я узнал и собрал благодаря практическому опыту работы в области машинного обучения за последнее десятилетие, работая в некоторых крупных консалтинговых фирмах и стартапах — Headstrong Capital Markets, Accenture, Evalueserve, Intent HQ, Quantplex Labs. ; Книга под названием Нескромные мысли также помогла мне кристаллизовать некоторые идеи и углубить мое понимание.

Общие правила стола

Следите за временем

Это общий совет.

Если вы зарезервировали 1 час на встречу или презентацию, это не значит, что вы протянете весь час; делите с умом. У хорошего часа, проведенного на собрании, должно быть время для ваших презентаций или других материалов, для вопросов и для обсуждения следующих шагов.

Тот факт, что команда подготовила множество графиков и визуальных материалов, не требует обсуждения каждого из них на собраниях. Сохраните 10 слайдов, сделайте каждый из них эффектным, а остальные поместите в приложение. Для 60-минутного обсуждения отведите 30 минут для вашего материала, 20 минут для вопросов и разъяснений и 10 минут для следующих шагов.

В идеале часовая встреча — это слишком долго — фон Нейман называл 53 минуты микростолетием — примерно через 40 минут большинство людей либо зевают, либо отвлекаются, поэтому плодотворно провести 30-минутную или 40-минутную встречу. У него есть еще одно преимущество, похожее на странное ценообразование: 101 фунт стерлингов кажется дорогим, а 95 фунтов стерлингов — приемлемым (двузначная или трехзначная психология). вам еще много временных интервалов.

На одном из интервью, которое, по моему мнению, прошло очень хорошо, мне сообщили, что интервью было запланировано на один час, но я пробежал 10 минут; на уровне директора/директора я должен был уложиться в один час. Это было откровением.

Краткость и ясность — ваши друзья.

Ваши встречи/колоды должны делать только одну точку

Повестка встреч/электронных писем/колод должна быть понятна не только вам, но и всем участникам, и лучше всего вести отдельные обсуждения по разным пунктам на разных этапах. Углубленное изучение качества данных и источников данных приведет лишь к пустой трате времени на совещании, предназначенном для формулирования технического задания, или на стартовом совещании.

Это не эмпирическое правило, так как оно время от времени нарушается, но часто бывает полезно придерживаться одного большого резкого момента за раз, особенно когда в аудитории более ~ 10 человек.

Найдите свою единственную точку и забивайте ее разными вариациями. Если качество ваших данных плохое, проиллюстрируйте это несколькими графиками на многих слайдах. Если вы хотите показать, что ваши модели строгие, покажите разные оценочные метрики — вы даже синтезируете метрики, которые работают в вашу пользу и являются стабильными — и покажите, как другие модели методы не работают.

Не пытайтесь сжать слишком много информации из широкого спектра областей, делайте ее простой. Не надейтесь на то, что люди поймут и запомнят каждую вещь из вашей сессии, поэтому более важно сделать ее яркой, чтобы они могли взять одну вещь домой.

Знай свою аудиторию

Были времена, когда мне приходилось объяснять, что такое линейная диаграмма или что обозначают усы на ящичковых диаграммах. Уместно знать аудиторию, с которой вы говорите; техническое глубокое погружение в случайный лес, CNN, LSTM и т. д. с пакетом C-уровня не подойдет, они могут быть заинтересованы в пунктах списка, результатах и ​​направленном характере консультативной работы; Сессия с инженерами и специалистами по обработке данных клиентской команды — это место, где вы должны быть готовы поговорить о нюансах данных, проблемах, тонкостях используемых алгоритмов и ключевых показателях эффективности MAPE, скорректированном R-квадрате, коэффициенте конверсии и т. д.

Вы должны знать, как курировать и направлять свои идеи в соответствии с аудиторией, с которой вы сталкиваетесь.

Кроме того, как правило, рекомендуется провести вторичное исследование на LinkedIn или любой другой платформе о прошлом людей, с которыми вы собираетесь встретиться (просто исследуйте, не преследуйте их жутким образом, посещая их профиль 10 раз в день :P) Это определенно помогает в знании областей, в которых они работают или работали в прошлом, так что вы можете построить разговор соответствующим образом или можете привести соответствующие примеры, которые могут быть удачными. Людям нравятся такие приготовления и подтверждения от других.

Мир данных — это не только мир технологий, но и мир людей, люди оценят ваше фоновое исследование и запомнят (надеюсь, по уважительным причинам) вашу презентацию, и это поможет привлечь их внимание.

Известный математик Джан Рота регулярно знакомился с публикой и упоминал работы менее известных математиков и тем самым приобретал последователей на всю жизнь. Люди, как правило, ценят такие жесты, и такая практика делает вас эффективным консультантом.

Что-то взять домой

Это один из самых важных моментов, которым широко и вообще пренебрегают. Даже если речь отличная и мотивирующая, цитаты лучших из спикеров, если в конце она не дает вам единственного, что вы можете из нее извлечь — Одного, что сводится к сути разговора — то это так же хорошо, как пшик, и ничего хорошего из ваших усилий не вышло.

Если ключевой вывод заключается в том, что качество данных необходимо улучшить, вам необходимо подтвердить это с помощью определенных диаграмм и того, как это влияет на результаты. Если ключевой вывод заключается в том, что вам нужно продление времени для модели, тогда сложность модели должна быть выделена, чтобы поддержать ваше утверждение.

В наши дни нас постоянно бомбардируют информацией, объем внимания находится на рекордно низком уровне, и это делает привычным иметь резкий вынос, который аудитория может запомнить.

Начните с историй, представляя определенные анекдоты и юмор, чтобы соединить точки с тем, что вы обсуждаете в целом хорошо; люди могут не вспомнить ваше имя, но они запомнят эти маленькие пикантные моменты.

Табличные правила в действии для специалистов по данным

Сценарий. Вы получили данные от клиента для анализа оттока клиентов, провели первоначальный предварительный анализ данных и обнаружили, что качество данных не соответствует тому, что было обещано во время первоначальных обсуждений, а многие необходимые функции отсутствуют. .

Ваша цель – сообщить заинтересованным сторонам об этой проблеме и запросить соответствующие функции.

Сервировка стола —

  1. Пригласите соответствующие заинтересованные стороны на 40-минутную встречу; поместите краткую и уместную строку темы вместе с краткой повесткой дня.
  2. Синтезируйте историю, которую вы бы использовали, обсудите ее и создайте колоду из 5–8 ползунков, в основном показывающую, каких наборов данных и функций не хватает. Покажите графики, которые усиливают %пропущенных данных, слабые корреляции и грубую регрессию, показывающую слабые причинно-следственные связи. Приведена только самая важная информация, остальное идет в приложении.
  3. Сделайте одно замечание — если анализ будет проводиться с текущими данными, каковы будут последствия — качество модели пострадает, и в результате направленный характер модели будет довольно пустым; или, если вы уже знаете, что качество данных нельзя улучшить, — дорожная карта сбора данных и то, как модель и, следовательно, результаты будут улучшаться с течением времени. Также покажите временную шкалу.

Прежде чем сесть за стол — как подготовиться?

Краткость — друг

Никто не любит высиживать длинную презентацию PowerPoint/keynote из 30 слайдов. Сделайте это 10 и покончите с этим, это помогает людям делать заметки по представленному материалу и сосредоточиться. Ваша работа как докладчика состоит в том, чтобы сделать так, чтобы аудитория могла понять идеи на месте, поэтому вместо того, чтобы сосредотачиваться на бесконечном томе колоды или списке тем для обсуждения, будьте проще и говорите больше, чем пролистать множество слайдов.

Фаза ранней подготовки и итерации

Начните хотя бы за неделю до важных встреч и создайте много черновиков. Напишите свою историю ручкой и бумагой, и как только вы будете удовлетворены потоком, переведите ее на колоду. Подумайте обо всех графиках и иллюстрациях, которые вы создадите, и о том, как каждый слайд будет переходить к следующему, по сути, вы организуете хорошо скоординированный танец, поэтому будьте готовы играть роль эффективного и контролирующего себя дирижера.

Написание одной и той же идеи несколько раз помогает кристаллизовать и усовершенствовать ее. Следуйте философии Фредрика Рисса по публикации идеи несколько раз с течением времени с постепенными улучшениями, здесь, в вашем случае, это будут аналогичные итеративные улучшения вашего материала в блокноте.

Кроме того, не помешает прислушаться к мнению пары человек, но убедитесь, что не привлекаете слишком много внимания к материалу, так как это может иметь неприятные последствия. 1. слишком много проблем с готовкой 2. Люди могут подумать, что вам не хватает уверенности в себе (звучит смешно, но однажды это случилось).

Лучшее объяснение — бритва Оккама

Рейс развивал свои идеи, читая лекции и объясняя один и тот же материал снова и снова в течение длительного времени, что помогало ему совершенствоваться и глубже понимать предмет, так же, как только вы приобрели достаточный опыт, вам также необходимо выбрать объяснения, диаграммы, методы, которые в большинстве случаев хорошо приземлялся у публики.

Ищите советы от других о том, как донести определенные моменты, если есть что-то, что вы можете позаимствовать, то будьте бесстыдны в этом.

Стиль

Есть только несколько трюков в торговле

Пол Эрдос и Дэвид Гильберт использовали поразительно схожие методы в своих индивидуальных исследованиях и доказательствах до такой степени, что многие математики часто предполагали, что все их доказательства можно свести к нескольким приемам, которые они используют.

Это может быть правдой, но работа была сделана, и это верно и для консультирования по науке о данных.

Как только вы побываете на достаточном количестве совещаний и презентаций и проведете несколько из них, вы выработаете свой собственный стиль. Это будет вашим планом передачи информации большой группе. После того, как вы определили свой секретный соус, вам нужно максимизировать силу — это может быть ваше повествование, ясность, юмор, способность давать концерты и т. д. Они будут вашим кругом компетенции, вокруг которого вы должны определять свои выступления.

Ошибки обязательно случаются

Что бы вы ни делали, в первоначальных набросках и планах будут ошибки, убедитесь, что они не фатальные. Джан Рота сказал: «Есть два типа ошибок: фатальные разрушают ваши теории и идеи, а случайные помогают проверить устойчивость, осуществимость идеи или теории.

Убедитесь, что в вашей работе нет фатальных ошибок, которые необходимо обсудить или представить; вы не хотите зайти в тупик. Вот почему пробные прогоны и составление всех возможных анкет, которые могут быть подняты, помогают хеджировать риски, с которыми вы можете столкнуться.

Кроме того, создание запаса прочности помогает преобразовать фатальные ошибки в случайные; запас прочности может заключаться в планировании большего количества времени или информировании людей о препятствиях впереди, которые могут возникнуть по разным причинам.

Но не все случайные ошибки плохи, они могут быть полезны для изменения исходных данных/деталей, но если предложенные идеи и теории остаются в силе, то вы можете знать, над какой частью ваших идей/теорий вам не нужно работать снова или изменять.

Эпилог — эффективное введение

Один математик однажды написал: «Правильное введение, резюмирующее историю предмета, излагающее содержание статьи в дискурсивной форме, привлечет к статье еще несколько читателей».

То, как вы вводите тему на собрании, описываете повестку дня в календаре, приглашаете участников, пишете тему холодного электронного письма или предоставляете учебный план семинара, оказывает большое влияние на конечных пользователей. Все они объясняют, что представляет собой произведение, цель и почему оно должно заинтересовать получателя.

Прилагая усилия к знакомству, вы можете помочь другим людям принять решение и даже убедить их принять участие.

Приведенные выше пункты не являются исчерпывающим набором слов, высеченных в камне, или их следует рассматривать как истину. Скорее, эти пункты аналогичны любой математической модели, которая по своей природе направлена.

Быть педантичным и привередливым в своем методе может показаться большинству людей бременем, но если это дает результаты и помогает вам подготовиться, сосредоточиться, выполнить и доставить, то это намного лучше.

Спасибо за чтение, пожалуйста, обратитесь ко мне, если у вас есть какие-либо вопросы для обсуждения или спорные вопросы, я всегда открыт для конструктивной обратной связи.