Теперь стало проще, чем когда-либо, начать совмещать оптимизацию принятия решений с машинным обучением.
В чем разница между машинным обучением (ML) и оптимизацией решений (DO)?
Каковы преимущества сочетания этих двух методов?
С чего начать? Здесь представлена ​​часто используемая проблема маркетинговой кампании, чтобы вы начали. Следуйте этому пошаговому руководству, в котором показано, как настроить этот образец с помощью Decision Optimization в Watson Studio.

ML и DO

Машинное обучение (ML) и Оптимизация решений (DO) - это два разных набора методов, которые исходят от Data Science (DS) и искусственного интеллекта (AI). Они включают в себя различные наборы математических инструментов для поддержки бизнес-аналитики.

О главном различии этих техник вы можете прочитать на простом примере здесь.

Возможности ML заключаются в извлечении неизвестных характеристик данных на основе воспроизводимых шаблонов. Например, после обучения модели на большом историческом наборе поведения клиентов телекоммуникационной компании, некоторые из которых ушли, вы можете ожидать, что ваша модель будет предсказывать будущий уход текущих клиентов только на основе их характеристик и поведения. ML может предсказать, кто из 10 000 клиентов может уйти, но он не скажет вам правильно, что делать с вашим маркетинговым бюджетом, чтобы оптимально избежать этого ухода.

Сила DO состоит в том, чтобы предписывать наборы решений, которые ограничены между собой. Например, модель может быть сформулирована для планирования операций производственной фабрики, где единицы должны проходить через разные наборы машин с разными характеристиками, которые будут производиться. DO может прописать оптимальный график производства единиц продукции для удовлетворения заданного спроса в 10 000 единиц, но не может сказать вам, каким будет этот спрос, даже с учетом истории производства.

У каждого набора техник есть своя золотая середина. Важно понимать разные типы данных, чтобы выбирать среди различных наборов методов.

Маркетинг кампании с ML + DO

Сочетание ML и DO может работать сильнее вместе. Поэтому важно использовать платформу, на которой эти различные наборы методов доступны и могут быть объединены.

Типичный вариант использования - использовать ML для прогнозов на основе исторических данных, а затем DO для решений, основанных на формулировках ограничений.

Типичное приложение, используемое во многих компаниях, - это маркетинг кампании.

При неизменном покупательском поведении и после обучения модели машинного обучения на большом количестве исторических клиентов вы можете ожидать, что ваша модель будет правильно предсказывать индивидуальное поведение новых клиентов. Затем, если действия, которые должны быть предприняты на основе этого индивидуального поведения, ограничены среди общих наборов клиентов (т. Е. То, что вы можете сделать для одного клиента, ограничивается тем, что вы делаете для других), вы можете сформулировать модель DO, чтобы предписать оптимальный способ потратить маркетинговый бюджет.

Некоторые люди будут утверждать, что DO не является необходимым для решения правой проблемы и что достаточно жадного алгоритма. Жадный алгоритм - это простой, интуитивно понятный алгоритм, который делает оптимальный выбор на каждом шаге, пытаясь найти общий оптимальный способ решения всей проблемы. Он воспроизводит простой человеческий подход к решению проблем. Давайте посмотрим, как он действует на простой задаче маркетинговой кампании.

Представьте себе следующий очень небольшой набор данных:

У вас всего 10 клиентов и 3 продукта. ML предсказал ожидаемый доход от продвижения каждого продукта каждому покупателю. Все ожидаемые доходы положительны, и при условии нулевой стоимости и неограниченной маркетинговой кампании вы можете просто продвигать каждый продукт каждому покупателю. Простой эффективный жадный алгоритм, который действительно находит оптимальный.

Но на практике мир ограничен. У вас ограниченный бюджет, не все продукты можно продвигать для всех клиентов и т. Д. Рассмотрим очень простой случай, когда:

  • конкретному покупателю можно продвигать не более одного продукта.
  • не более 3 клиентов могут продвигать данный товар

Какое оптимальное решение?

Жадный алгоритм, вероятно, упорядочит все ожидаемые доходы и начнет с Клиента 6, назначит ему Путешествие, затем возьмет следующий более высокий доход и т. Д. Этот алгоритм приводит к правильному решению. но не оптимальный. Фактически, оптимальное решение (770 долларов США) не включает эту комбинацию Клиент 6 - Путешествие.

На этом небольшом дидактическом примере вы можете потерять 30 долларов и, следовательно, почувствовать, что жадный алгоритм достаточно хорош. Но в реальной жизни у банков миллионы клиентов и десятки продуктов. Следовательно, жадные алгоритмы могут работать хуже, чем этот разрыв в 5% от оптимального, и даже небольшой процент хорошо улавливать, когда он применяется к миллионам долларов.

Любой, кто думает, что жадные алгоритмы достаточно хороши для решения задач оптимизации, полностью упустил суть науки о данных.

Оптимизация решений для Watson Studio

Ранее в этом году я писал, что Оптимизация принятия решений теперь доступна в облаке как часть Watson Studio. Вы можете без каких-либо затрат создать блокнот на Python и начать использовать DO с API docplex.

С этого момента начать работу стало еще проще, поскольку IBM представила возможность создавать новый проект на основе образца шаблона. В результате получился рабочий блокнот, с которого можно начать и модифицировать по своему усмотрению.

Давайте посмотрим, как это сделать:

1- Вам нужен идентификатор IBM для входа в Watson Studio.

Для этого есть видео с подсказками.

2- Войдите в Watson Studio

URL-адрес: https://dataplatform.cloud.ibm.com/.

3- Создайте «новый проект»

4- Выберите «Создать проект из образца или файла».

5- Выберите «Из образца»

6- Выберите образец маркетинговой кампании

7- При необходимости измените название проекта и нажмите «Создать».

Проект будет создан автоматически, наборы данных и записная книжка будут импортированы и связаны с правильным токеном проекта и средами Jupyter.

Затем вы можете открыть записную книжку и запустить ее, как указано в поле readme:

Чтобы запустить блокнот:

  1. Перейдите на страницу "Активы".
  2. В разделе «Блокноты» щелкните значок карандаша в той же строке, что и имя записной книжки, чтобы открыть записную книжку в режиме редактирования и выполнения.
  3. Обведите все ячейки тетради от начала до конца.

Блокнот самодокументирован, поэтому вы можете понять его и изменить в соответствии с вашими потребностями, чтобы начать свой собственный проект ML + DO.

Основные части:

  • Анализ исторических данных: загрузите исторические данные из набора данных проекта и проведите визуальный анализ, чтобы понять, какие функции следует использовать для обучения модели.
  • Обучите модель для прогнозирования поведения клиентов: обучайте по одной модели для каждого продукта,
  • Предсказание поведения нового клиента: загрузка новых данных с неизвестным поведением и применение обученных моделей для прогнозирования ожидаемого дохода для каждого нового клиента,
  • Назначьте лучшие бизнес-решения: сформулируйте модель DO и запустите ее на неизвестных данных о поведении, дополненных прогнозируемым ожидаемым доходом, чтобы решить, какие действия следует предпринять,
  • Проведите некоторый анализ «что, если». Одно из преимуществ DO - это возможность выполнять анализ «что если», ища оптимальное решение для различных сценариев данных или ограничений. Здесь мы смотрим на оптимальные решения в зависимости от маркетингового бюджета.

Сравнение модели DO и жадного алгоритма исследуется в другой версии этого блокнота, доступной в сообществе.

Еще одно типичное применение ML + DO - это профилактическое обслуживание, при котором ML прогнозирует, когда некоторые активы могут выйти из строя, а DO планирует мероприятия по обслуживанию. Блокнот, показывающий этот вариант использования и с очень похожей структурой, доступен в сообществе.

Обратите внимание, что помимо ноутбуков в бета-версии доступен специальный опыт для создания моделей DO.

Вывод

Decision Optimization - идеальный помощник для машинного обучения. Существует много путаницы, иногда сводя AI или DS к ML и игнорируя DO. Нет сомнений в том, что на сегодняшний день методы, управляемые данными, такие как машинное обучение, не могут решить проблемы оптимизации, когда несколько решений связаны глобальными ограничениями. Только ДЕЙСТВИТЕЛЬНО может решить эти проблемы. Хорошая новость заключается в том, что DO теперь проще использовать и его легче комбинировать с машинным обучением для создания полных алгоритмов для прогнозирования данных и предписания решений.

[email protected]

@AlainChabrier

Https://www.linkedin.com/in/alain-chabrier-5430656/