Организации во всех отраслях используют ИИ. Gartner сообщает, что уровень внедрения этой технологии составляет 37 %¹, и этот темп только ускоряется.

Большая часть современного ИИ основана на статистическом машинном обучении, дисциплине, основанной на идее, что компьютеры могут изучать полезные вещи из данных практически без человеческого контроля, знаний в предметной области или пользовательского кодирования. С более технической точки зрения, машинное обучение стремится делать прогнозы относительно группы переменных на основе наблюдений за другой группой после наблюдения и изучения закономерностей совместного появления переменных из исторических записей. Кроме того, подход машинного обучения стремится раскрыть такие отношения независимо от механизма, сгенерировавшего данные. Фактически, машинное обучение — это оценка математической функции, которая имитирует неизвестный механизм генерации данных без необходимости настраивать его внутреннюю работу. Учитывая независимую от предметной области природу машинного обучения, инструменты и алгоритмы, которые оно предоставляет, созданы для решения любых задач, от обработки естественного языка до анализа изображений, от максимизации прибыли и торговли акциями до рекомендаций фильмов и так далее.

Однако когда теория встречается с реальным миром, история не всегда протекает так гладко. Во-первых, несмотря на независимые от предметной области перспективы машинного обучения, большинство людей осознают необходимость разработки или выбора, а также калибровки и точной настройки алгоритма для данного конечного приложения. Что еще более важно, результаты машинного обучения часто трудно контекстуализировать, объяснить и экстраполировать, что ставит под угрозу принятие рекомендаций, созданных ИИ. Это особенно важно в деловом мире и устоявшихся отраслях, где машинное обучение рассматривается как технология, предназначенная для замены того, что воспринимается как укоренившиеся «проверенные и надежные» процессы и парадигмы принятия решений, будь то управление отношениями с поставщиками или интеграция ИИ в медицинскую диагностику. Наконец, часто упускаемый из виду аспект ИИ — это обязательство, которое организация должна взять на себя и выполнять для сбора и предоставления на постоянной основе чистых, полных и актуальных записей данных для алгоритмов машинного обучения, интенсивно использующих данные. Бремя может иногда означать провал или отказ от проекта еще до его начала или только после короткого периода экспериментов.

Рассмотрим некоторые из этих вопросов более подробно.

Контекстная адаптация и предсказуемость в изменяющихся условиях

Если мы согласимся с тем, что машинное обучение связано с предсказаниями — слово, которое в сознании большинства людей ассоциируется с каким-то событием в будущем, — можно удивиться, узнав, что существующие алгоритмы машинного обучения намного лучше справляются с классификацией и распознаванием в настоящем. чем проецировать свои знания из прошлого в будущее. Делать предсказания будущего, очевидно, не означает что-то вроде предсказания хрустального шара, а вместо этого открывать достаточно контекста вокруг данных, чтобы делать разумные предсказания в будущем, даже если будущие обстоятельства не совсем совпадают с историческими. те.

Давайте проиллюстрируем это на простом примере из мира бизнеса. Предположим, консультанту-аналитику поручили выполнить задание по мерчандайзингу для розничного продавца. В рамках этого задания аналитика интересуют вопросы о наиболее продаваемых ассортиментах товаров, а также о правильном выборе времени (сезон, время суток, день недели), местонахождении (регион, магазин и т. д.), а также ценах и рекламных акциях. часто вплоть до уровня SKU. Предположим, аналитику предоставляется набор данных, состоящий из кодов предложений, которые работали в исторический период, данных об их продажах и стоимости до и после запуска, а также данных рыночного тестирования для тщательно разработанных тестовых и контрольных групп. Хотя таких данных может быть более чем достаточно для анализа прошлых показателей предложений, что они могут сказать о будущем? Например, как распространить анализ на новые предложения, которых даже не существовало в исторический период? В надежде на обобщение можно связать множество временных кодов предложений с меньшим набором стабильных атрибутов и применить машинное обучение, чтобы понять, как атрибуты влияют на производительность. Это может помочь, но только до некоторой степени. Например, что, если предложение, которое нужно запустить, относится к новому продукту? Следует ли сравнивать эффективность нового предложения с предыдущими предложениями в той же категории или подкатегории? Если да, то на основе каких факторов параметры нового продукта, такие как ценовая эластичность, должны быть скорректированы, если вообще должны быть скорректированы, чтобы сделать достоверные прогнозы? Как должны быть расширены результаты, когда продажи сильно взаимодействуют с брендом, конкурентными тенденциями и другими факторами? Как следует учитывать изменения в сети поставщиков при анализе? Как все это влияет на общую стратегическую картину компании?

Подобные вопросы — не просто теоретические размышления, это вещи, которые ежедневно расстраивают бизнес-пользователей по поводу доступной им аналитики, что в результате наносит ущерб внедрению и использованию широкого спектра передовых аналитических технологий, включая машинное обучение и искусственный интеллект.

Без необходимости расширять масштаб проекта машинного обучения и наполнять модель всевозможными нерелевантными измерениями и атрибутами — это не выход. Вместо этого решение следует искать в подходах, которые обеспечивают высокие уровни рассуждений, которые вплетают соответствующий контекст в анализ. Графы знаний относятся к числу инструментов, которые потенциально могут быть использованы для глубокого обнаружения сходств и отношений между, казалось бы, несвязанными объектами, что позволяет перенести обучение из обучающего набора в прошлом в невидимую среду в будущем.

Технологии, обеспечивающие контекстуальную адаптацию, составляют третью волну AI². Среди других заинтересованных сторон Агентство перспективных исследовательских проектов Министерства обороны США (DARPA) активно ищет теории и приложения, которые помогут машинам понимать и адаптироваться к контексту так же, как это делает человеческий мозг³.

Доказательная аргументация для быстрого принятия решений

Большинство людей, которые потратили время на борьбу с реальными данными, согласны с тем, что данные почти никогда не бывают полными. Это, очевидно, серьезная проблема, поскольку данные являются топливом для машинного обучения. На самом деле, чем более продвинутый алгоритм, тем больше он будет потреблять данных.

Есть много ситуаций, когда возникает проблема отсутствия данных. В потребительских и политических опросах довольно часто встречаются отсутствие ответов или частичные ответы. В здравоохранении отсутствие данных является скорее нормой, чем исключением, учитывая, что, среди многих других причин, большая часть очень ценных данных о пациенте вводится вручную. В рекламных технологиях наблюдения за воздействием маркетинговых точек соприкосновения с потенциальными клиентами в лучшем случае частичны.

Отсутствующие данные могут классифицироваться по-разному. Они могут сигнализировать об информации, как в политических опросах, но также могут быть результатом случайных упущений или вызваны разрозненными конфигурациями данных.

Даже если данные полны для целей обучения, применение обученной модели для прогнозирования и принятия решений может снова создать проблему отсутствия данных. Например, хотя полные данные о лицах могут быть доступны для разработки моделей оценки потенциальных клиентов, решение о присвоении оценки лицу с использованием обученной модели может быть основано на частичных поведенческих данных, которые дешево собираются в режиме реального времени. . Другие случаи связаны с переменными, которые могут быть известны, но неизвестны во временном масштабе принятия решения из-за задержек и затрат. Например, функциональные менеджеры во всех организациях часто используют относительно недорогие сигналы и индикаторы в режиме реального времени для повседневных решений, а не полагаются исключительно на подробные данные и отчеты, которые будут доступны только ежеквартально или ежегодно. В ситуации быстрого реагирования критически важные решения необходимо принимать в режиме реального времени без доступа ко всем соответствующим данным и фактам.

Чтобы машины быстро реагировали на изменения окружающей среды, они должны быть оснащены способностью рассуждать на основе доказательных входных данных. В отличие от полных данных свидетельство является частичным, что означает, что оно информирует о подмножестве входного пространства. Кроме того, свидетельства могут быть выражены в терминах вероятностей, границ или других ограничений вместо фиксированных значений.

Мультимодальность и принятие решений с использованием нескольких источников

В последнее время много внимания уделяется мультимодальному ИИ. Мотивацией, как и в большинстве других областей ИИ, является человеческий опыт. Мы видим, слышим, чувствуем, обоняем и пробуем на вкус. В то время как каждый сенсорный опыт информирует о каком-то аспекте окружающего нас мира, наш мозг объединяет наши мультимодальные переживания, чтобы прийти к целостному пониманию окружающей среды. Наш мультимодальный опыт также помогает нам заполнить пробелы в сенсорных данных. Например, движение чьих-то губ может помочь нам лучше понять произносимые слова.

Большая часть недавнего интереса к мультимодальному ИИ связана с сенсорными модальностями (визуальными, звуковыми, текстовыми и т. д.). Здесь наш интерес выходит за рамки того, чтобы включить способы объединения и рассуждения о знаниях, полученных из нескольких источников, не прибегая к необработанным данным, лежащим в основе информации, предоставленной каждым источником. В деловом мире есть много примеров того, почему мультимодальность, как определено выше, актуальна и на самом деле имеет решающее значение. Функциональный менеджер может иметь доступ к нескольким показателям, опросам и, возможно, даже результатам машинного обучения, основанным на этих и других активах данных, каждый из которых использует необработанные данные, собранные в разных масштабах, с разной степенью детализации, периодами времени и временными разрешениями, каждый из которых говорит о другом. или даже противоречивый рассказ о принципиально взаимосвязанных аспектах бизнеса.

Попытка объединить все необработанные данные, лежащие в основе каждого отдельного наблюдения, в единую модель машинного обучения будет бесполезным занятием, учитывая разнородность данных и сложность отношений между ними. Вместо этого можно разработать глубокую архитектуру с отдельными моделями машинного обучения, находящимися в каждом источнике, а выходные данные каждого источника взвешиваются и адаптивно комбинируются для прогнозирования интересующего результата. Например, решение для мерчендайзинга может состоять из нескольких связанных модулей машинного обучения, каждый из которых специализируется на одном конкретном аспекте проблемы (использование продукта, тенденции, предложение, спрос и т. д.).

Сводка

За десятилетия машинное обучение и ИИ пережили множество определяющих моментов и переходов. Чтобы технология получила более широкое распространение в деловом мире, уже недостаточно изучить закономерности в данных из прошлого, чтобы сделать классификации в настоящем, а достаточно узнать контекст вокруг данных, чтобы спроецировать изученные закономерности. в будущее в условиях, которые, возможно, не встречались в исторических записях. Кроме того, поскольку технологии искусственного интеллекта продолжают внедряться в процессы принятия решений в режиме реального времени и человеко-машинные интерфейсы (например, чат-боты), способность рассуждать на основе доказательной информации будет иметь решающее значение. Наконец, проблемы машинного обучения редко можно изолировать от их контекстных данных и данных об окружающей среде, которые часто доступны из внешних источников, таких как графики общедоступных знаний. Чтобы эффективно использовать такую ​​информацию, будет нецелесообразно просто объединять все потенциально подходящие необработанные данные, а вместо этого использовать глубокую архитектуру с использованием многоступенчатой ​​мультимодальной структуры рассуждений.

Хотя полнофункциональные системы, отвечающие перечисленным выше задачам, еще не материализованы, междисциплинарные группы активно изучают вспомогательные технологии и строительные блоки, и многие из них используются в различных приложениях и отраслях.

[1]: Опрос более 3000 ИТ-директоров, проведенный Gartner, показал, что предприятия вступают в третью эру ИТ. https://www.gartner.com/en/newsroom/press-releases/2018-10-16-gartner-survey-of-more-than-3000-cios-reveals-that-enterprises-are-inting-the -третья-эра-этого

[2]: ИИ третьей волны: грядущая революция в искусственном интеллекте. https://medium.com/@scott_jones/ Third-wave-ai-the-coming-revolution-in-artificial-intelligence-1ffd4784b79e

[3]: DARPA объявляет о кампании стоимостью 2 миллиарда долларов по разработке следующей волны технологий искусственного интеллекта. https://www.darpa.mil/news-events/2018-09-07