Как перенести машинное обучение с POC на основную организационную возможность

В наши дни многие компании добиваются успехов в машинном обучении (ML). Скачки в распознавании изображений и обработке естественного языка, которые стали возможными благодаря недавним достижениям в области глубокого обучения и значительному увеличению объема доступных данных, сделали ИИ * на корпоративном радаре практически повсюду. Машинное обучение превзошло людей и позволило компаниям обрабатывать запросы на обслуживание в таком масштабе, который просто невозможен со 100% службой поддержки. Он нашел успешные применения в самых разных областях, от обнаружения мошенничества до анализа медицинских изображений, от машинного перевода до индивидуальных рекомендаций. Так как многие заголовки в ML сделаны группой GAFA, вполне естественно, что вы, как руководитель или менеджер по обслуживанию, смотрите на них, когда начинаете изучать приложения искусственного интеллекта для своего бизнеса. Помимо очевидных проблем, связанных с этим подходом (ваша компания, вероятно, все еще работает в автономном режиме), есть некоторые менее обсуждаемые проблемы, которые я хочу затронуть в этом посте.

* AI = прикладное машинное обучение

Во-первых, достижения, рекламируемые в крупных технологических заголовках, затемняют масштабное начинание и годы разработки, человеческие операции, инвестиции и неудачные проекты, лежащие в основе их успеха. Конечно, это не должно быть препятствием для начала изучения приложений машинного обучения, но может быть полезно иметь это в виду при создании вашей первой команды машинного обучения или спонсировании вашего первого доказательства концепции - ML еще далек от зрелости, и некоторые проекты потребуют крупных предварительных вложений, чтобы их можно было применить в промышленных условиях. В качестве примера: если бы я перевел приведенную выше диаграмму в среду LSE без надлежащей инфраструктуры данных, это было бы примерно эквивалентно 10 FTE, работая в течение двух лет, чтобы приблизиться к базовой масштабируемой платформе машинного обучения. И за все это время и деньги вы только купите некоторую инфраструктуру (модели не включены). Как только ваши команды достигнут этой точки, ожидайте, что они будут работать полный рабочий день над конвейерами данных, управлением изменениями, операциями, интеграциями и разработкой моделей. Это значительные вложения для LSE - от 1 до 10 млн евро в зависимости от ваших амбиций, размера и географического положения. С учетом необходимых предварительных вложений в инфраструктуру данных (озеро данных / ров / болото / сток) прогнозируемые затраты на такие усилия могут быстро вырасти до десятков миллионов евро.

Как ни странно, наиболее распространенный подход к внедрению машинного обучения на предприятии, которое я видел, - это летать вслепую (заметным исключением было видение Ронни Фелинга индустриализации ИИ в Airbus; с тех пор он перешел в BCG). Кажется, что огромное количество ажиотажа вокруг искусственного интеллекта освободило типичного члена совета директоров от ответственности за разумное управление проектами и долгосрочное стратегическое мышление. Это опасная ситуация, поскольку многие из этих инвестиций в ИИ повсюду проистекают непосредственно из того факта, что все инвестируют в ИИ, а не из жизнеспособного бизнес-обоснования и стратегии выпуска. И все мы знаем, что FOMO, как и финансовые рынки, в лучшем случае непредсказуем. Учитывая, что данные сравниваются с маслом (спойлер - это не так, разные внешние эффекты), ИИ с электричеством (также неверно, многие рутинные вещи не требуют когнитивных способностей) и ML с кулинарией (для практиков), я хотел бы предложите новую аналогию, которая, мы надеемся, позволит вам лучше понять траекторию внедрения ИИ в мировой экономике в следующие пятьдесят лет: траекторию полета.

При всем нынешнем волнении по поводу мгновенной доставки с помощью дронов (позвольте мне запустить свой бублик) легко забыть, что потребовалось более 100 лет, чтобы добраться до точки, в которой полет станет настоящим товаром. Даже если мы достигнем этой точки в ближайшем будущем, большая часть ожидаемых 855 миллиардов долларов доходов от авиаперевозок, полученных коммерческими авиакомпаниями в 2019 году, будет поступать от перевозки людей - бизнес-модели, столь же старой, как и первая коммерческая авиакомпания. Точно так же, когда мы смотрим на машинное обучение, основной вклад в добавленную стоимость в наш мир 21-го века, измеряемый операционным доходом и курсами акций, по-прежнему в основном оплачивается. Возникает вопрос, можем ли мы ожидать, что в ближайшие годы промышленные приложения машинного обучения вырастут за пределы приложений, основанных на персонализации. Многие люди делают ставки на приложения Интернета вещей (IoT). Хотя Интернет вещей действительно генерирует большой объем данных, без экономии на масштабе и надлежащей инфраструктуры ценность приложений машинного обучения в этой области не будет перевешивать их затраты. А управление системами ML в промышленных масштабах - в отличие от POC - требует контроля качества, непрерывного обслуживания и постоянного улучшения - изрядная цена, если улучшения, предлагаемые ML, являются лишь незначительными. То есть я не ожидаю, что использование аналога ML для диспетчерской вышки для умных холодильников будет экономически выгодным. До сих пор профилактическое обслуживание - это единственное приложение за пределами потребительской сферы, в котором машинное обучение нашло широкое распространение. С другой стороны, приложения машинного обучения в потребительской сфере снова и снова зарекомендовали себя. Взаимодействие человека и машины значительно выиграло от машинного обучения. Мы являемся свидетелями того, как ИИ становится основным потребительским интерфейсом с машинами для подавляющего большинства людей на этой планете благодаря поисковым системам, умным помощникам, умным камерам и автономному вождению среди прочего.

Это опасная ситуация, поскольку многие из этих инвестиций в «ИИ повсюду» проистекают непосредственно из того факта, что все инвестируют в ИИ, а не из жизнеспособного бизнес-обоснования и стратегии выпуска.

Возвращаясь к аналогии с полетом, помимо бортового экипажа, который управляет самолетом, самолету требуются наземные экипажи и достаточная инфраструктура, чтобы гарантировать, что люди и грузы на маршрутах, по которым летают самолеты, связаны с остальной частью экономики. Другими словами, авиакомпании поддерживаются более крупной цепочкой создания стоимости и экосистемой за пределами авиационной отрасли. То же самое и с ML - оно не находится в вакууме. Команда, оперативно ответственная за разработку и поддержку моделей - специалисты по обработке данных, инженеры по обработке данных, менеджеры по машинному обучению, бизнес-аналитики и т. Д. - является частью цепочки создания стоимости предприятия и более широкой ИТ-экосистемы, состоящей из корпоративных приложений, бизнес-процессов, инфраструктуры данных и вычислительных ресурсов. . Хотя эти внешние эффекты очевидны для людей, которые проектируют и строят аэропорты, в проектах машинного обучения они часто явно игнорируются. Даже если хорошо спроектированный алгоритм машинного обучения определенно не повредит вашим шансам на успех, без надлежащей интеграции прогнозов модели во внутренние или ориентированные на клиентов бизнес-процессы - пользовательский интерфейс машинного обучения и UX - и более широкую цепочку создания стоимости и экосистему, ваш проект почти наверняка потерпит неудачу. Фактически, в отсутствие эмпирических доказательств (о которых я знаю) я хотел бы поспорить, что на успех или неудачу многих проектов ML больше влияет корпоративный спонсор и заинтересованное лицо, чем то, что сама команда ML управляет. производить во время проекта.

Это подводит меня ко второму пункту. Создание ценности с помощью машинного обучения чаще всего является организационной, а не технической проблемой. Таким образом, специалисты по машинному обучению не могут решить эту проблему независимо от остальной части организации. Многие проекты машинного обучения, направленные на создание ценности для бизнеса, терпят неудачу, потому что требуют сотрудничества между бизнесменами и технологами. Это означает, что компаниям, которые решаются перейти в этот дивный новый цифровой мир 21-го века, не только необходимо принять новую и незнакомую технологию (ИИ), но им также необходимо перейти от организационной обособленности (и управления рисками айсберга) к более гибким организационным линиям. привлечены созданием ценности, а не бизнес-функцией (см. эту статью о McKinsey для введения в платформенные организации). После того, как вы успешно справитесь с этими переходами, вы сможете получить невероятные выгоды в виде улучшений во взаимодействии с клиентами, экономической эффективности и общей привлекательности, которую вы получите от вашей ставки на машинное обучение (вложения в него). Поскольку цифровые инструменты, которыми сегодня располагают компании, устраняют необходимость в большинстве прямых взаимодействий между людьми, потенциально любая кросс-функциональная команда может напрямую взаимодействовать со своим клиентом через цифровые интерфейсы, устраняя необходимость в продажах, HR, или обслуживающий персонал, который когда-то был лицом компании. Эта логика применима как для команд, в которых основной клиент является внутренним (например, отдел кадров или финансов), так и для команд с внешними клиентами (продажи, предоставление услуг и т. Д.).

Повторюсь, ИИ должен быть встроен в бизнес-процессы для создания ценности. Следовательно, это означает прикосновение, изменение и улучшение детерминированной бизнес-логики, реализованной в ИТ-среде компании. Что, скажу вам заранее, приведет к большому количеству работы, а затем к более неожиданной работе в дополнение к этому большому количеству работы. Помимо этой доработки существующих бизнес-процессов, для операционных продуктов на основе ИИ также требуется платформа машинного обучения, которая облегчает быструю разработку, развертывание и мониторинг множества прогнозных процессов, встроенных в продукты, бизнес и операции фирмы. Это означает сквозную прослеживаемость данных, потоки данных с малой задержкой для процессов, близких к реальному времени, и доступ к данным межфункциональных групп ко всем потокам данных, проходящим через организацию. В этом смысле приложения машинного обучения сильно отличаются от предыдущих волн автоматизации. Внедрение автоматизированных когнитивных и вероятностных возможностей влечет за собой повышенную потребность в контроле качества процессов, управляемых данными. А это - к сожалению для вас - требует более тесного и улучшенного сотрудничества между заинтересованными сторонами бизнеса и технологами.

Странно то, что часто компании оставляют работу над проектом ML специалистам по данным. Независимо от того, является ли этот специалист по обработке данных внешним подрядчиком или внутренним сотрудником, он или она, как правило, плохо подготовлены для работы с политикой компании и часто не имеют корпоративного мандата на внесение изменений в существующие бизнес-процессы. Это приводит к тем ужасным MLPOC, которые не приносят никакой пользы для бизнеса. Специалисты по обработке данных с низким уровнем подготовки и аспирантами применяют рабочий процесс, которым они научились в академических кругах, для решения бизнес-задач. Кто-то где-то находит сервер, и модель планируется без мониторинга, пока специалист по данным переходит к следующему MLPOC. Все довольны (мы сделали AI!), И ничего особенного не изменилось. Это очень черно-белое изображение, но оно подчеркивает одну из основных проблем индустриализации ИИ. Без надлежащего проектирования и выполнения проектов проекты машинного обучения рискуют попасть в ловушку бесполезного подтверждения концепции машинного обучения (MLPOC), в котором руководители создают проекты машинного обучения из FOMO, а специалисты по обработке данных применяют то, что они узнали в аспирантуре. школы, и никто не хочет брать на себя ответственность за то, чтобы проект генерировал реальные ROMLI (возврат инвестиций в машинное обучение).

В этом смысле приложения машинного обучения сильно отличаются от предыдущих волн автоматизации. Внедрение автоматизированных когнитивных и вероятностных возможностей влечет за собой повышенную потребность в контроле качества процессов, управляемых данными.

Короче говоря, бессистемный характер финансируемых сегодня усилий по машинному обучению - это рецепт катастрофы. Вдобавок ко всему, не все в вашей организации относятся к тем безнадежным оптимистам, которые думают, что машинное обучение может улучшить условия труда во всем мире за счет автоматизации рутинных когнитивных задач, тем самым освобождая нас, людей, для более интересной работы. Есть много людей, которые боятся, что автоматизация возьмет на себя их работу, боятся потерять способность принимать решения или просто боятся перемен, которые приводят к затяжной политической тени и окопным войнам, которые замедляют работу машин. по всему миру (жирные смайлики с грустным лицом). Долгосрочный риск как для практиков в области ИИ, так и для потребителей заключается в том, что после множества чрезмерных обещаний и неутешительных результатов предприятия будут продолжать работать в обычном режиме еще несколько десятилетий. И это досадно, потому что это означает, что ваши клиенты будут вынуждены продолжать жить в технологическом эквиваленте 80-х. Подводя итог, можно сказать, что для работы любого проекта машинного обучения необходимо наличие нескольких предварительных условий:

Для команды машинного обучения

  • Инфраструктура данных для моделей машинного обучения.
  • Вычислительная инфраструктура для обучения моделей машинного обучения.
  • Путь к производству, интегрирующий прогнозы модели в приложения.
  • Инфраструктура мониторинга и AB-тестирования для измерения влияния прогнозов модели на бизнес и аналитические KPI.

Что касается бизнеса,

  • Идентификация бизнес-процессов, в которых могут применяться автоматизированные прогнозы с достаточным объемом ROMLI, чтобы оправдать усилия: бизнес-процессы с большим объемом, малой задержкой, высокими затратами, рутинными когнитивными, опасными и т. Д.
  • Согласование межфункциональных заинтересованных сторон вокруг бизнес-процессов, которые можно улучшить или облегчить с помощью машинного обучения.
  • Разработка жестких ограничений - эпистемических границ - с помощью моделей машинного обучения может работать.
  • Мониторинг бизнес-KPI и предоставление (желательно статистически обоснованной) обратной связи команде машинного обучения.

Как вы можете видеть из списка выше, команде машинного обучения во всем этом дается простая задача. Самая сложная часть - это согласование и изменение вашей организации, чтобы вы могли в полной мере использовать возможности, предлагаемые технологическими достижениями в области машинного обучения. Это то место, где сегодня продолжает развиваться большинство проектов машинного обучения. Поскольку команда ML или ее прямой спонсор часто не имеет полномочий работать над межведомственными бизнес-процессами, если вы хотите серьезно заняться машинным обучением, вам необходимо лично контролировать и направлять эти проекты или назначить кого-то с достаточно широкие полномочия для выявления и облегчения изменений существующих бизнес-процессов с помощью машинного обучения или разработки новых процессов, основанных на возможностях машинного обучения.

Заявление об ограничении ответственности: я внештатный инженер по машинному обучению, поэтому в моих интересах, чтобы машинное обучение успешно внедрялось в организациях и предоставляло моим клиентам максимальный ROMLI (возврат инвестиций в машинное обучение). Есть файл cookie.

Скриншоты взяты из картины Альфреда Хичкока «Север за северо-западом» 1959 года.