Оптимизация правил нокаута для кредитования

У людей есть много важных причин для того, чтобы подать заявку на ссуду в ING, купить свой первый дом, отремонтировать существующий, отправиться в отпуск с семьей или друзьями и многое другое. Заявка на получение ссуды обычно проходит многоэтапный процесс, который занимает очень много времени. В этом посте мы увидим, как оптимизируя один этап процесса подачи заявки на получение кредита (правила выбивания), мы можем быстро и эффективно выплатить ссуду. Сокращая время, необходимое для обработки этих заявок на получение кредита, мы надеемся дать нашим клиентам возможность делать свое дело.

Типичный рабочий процесс для розничной / ипотечной ссуды работает следующим образом:

Существующий или новый клиент подает заявку на получение кредита через различные онлайн или офлайн каналы банка.
После получения заявки банк проводит ее собственную проверку. Эта проверка представляет собой многоэтапный процесс. Некоторые шаги автоматизированы, а другие нет. Каждый этап процесса проверки обычно приводит к сокращению количества заявок на 15–20%.
Если результаты всего процесса проверки положительны, клиенту предоставляется ссуда.

Одним из этапов этого многоэтапного процесса проверки является проверка того, соответствует ли клиент определенным правилам приемлемости, также известным как правила Knock Out (KO). Правила исключения - это правила принятия решений на основе экспертов для исключения приложений с высоким риском. Например. запрашиваемая сумма кредита должна быть меньше или равна 20-кратному ежемесячному доходу заявителя, или ежемесячный доход заявителя должен превышать 1000 евро и т. д. Эти правила были созданы экспертами в прошлом, чтобы помочь им в принятии кредитных решений с помощью простых линейные модели, когда более сложные модели кредитных решений (CDM) были невозможны или недоступны. Правила KO обычно применяются либо до, либо вместе с CDM, чтобы определить соответствие заявки требованиям. Для типичной розничной ссуды может быть от 50 до 60 правил выбывания как для основного, так и для дополнительного заявителя.

Хотя правила KO хорошо работали в прошлом, они вводят накладные расходы на обработку, а также приводят к исключению значительного числа приложений. Некоторые из этих кандидатов предлагают реальные возможности кредитования, которые не реализуются из-за этих правил KO. Следовательно, есть необходимость их оптимизировать.

Оптимизация правил нокаута должна привести к:

Уменьшение количества правил.
Увеличение количества выданных кредитов.
Ставка по умолчанию (количество клиентов, не выполняющих свои платежи) должна быть ниже определенного порога.

Как видите, некоторые из этих целей конкурируют друг с другом. Например, при увеличении количества выданных займов уровень дефолта может возрасти. Важно одновременно учитывать конкурирующие цели при оптимизации правил KO.

Методы многоцелевой оптимизации помогают нам оптимизировать несколько задач одновременно и предоставляют набор оптимальных решений. В общем, у многоцелевых проблем нет единого решения, которое лучше всего подходит для всех целей, но может существовать несколько решений, оптимальных для разных целевых функций. Одним из таких алгоритмов для решения многокомпонентной задачи является недоминируемая сортировка с генетическим алгоритмом-II (NSGA-II), предложенная Деб К. и другими в 2002 году.

NSGA-II имеет следующие особенности:

Он использует элитарный принцип, то есть лучшие решения населения получают возможность передаваться следующему поколению.
Он акцентирует внимание на решениях без доминирования.
Is использует явный механизм сохранения разнообразия (Crowding Distance)

Чтобы понять NSGA-II, важно иметь фундаментальные знания о генетических алгоритмах и следующих двух ключевых понятиях:

Недоминантная и множество Парето:

Доминирование : Решение x считается доминирующим над другим решением y, если выполняются оба условия 1 и 2 ниже:

Условие 1: x не хуже y для всех целей.
Условие 2: x строго лучше, чем y, по крайней мере, по одной цели

Не доминирующий набор: среди набора решений P, не доминирующий набор решений P ' - это те, в которых не доминирует ни один член множества P

Глобально оптимальное по Парето множество: недоминируемое множество всего допустимого пространства поиска S является глобально-оптимальным по Парето множеством.

2. Расстояние между толпами:

Значение расстояния вытеснения решения дает оценку плотности решений, окружающих это решение. Это среднее расстояние между решением и соседними решениями.

Подробное описание и принцип работы NSGA-II можно найти здесь. Обобщенная блок-схема представлена на рисунке 2.

Таким образом, чтобы оптимизировать правила KO, нам необходимо определить правила KO для оптимизации, с помощью CDM мы можем вычислить другую цель, такую как процент по умолчанию и увеличение количества заявок для различных комбинаций правил KO. Результатом процесса оптимизации будет меньший набор правил KO, который приведет к большему количеству выданных займов и при сохранении контроля над уровнем дефолта.

Давайте посмотрим, как работает процесс оптимизации на реальном * наборе данных из сценария использования дефолт по автокредиту. Мы создали 10 правил KO и хотим их оптимизировать. Когда эти правила не оптимизированы, клиент получает ссуду только в том случае, если он проходит все эти 10 правил KO. ~ 26k из ~ 70k клиентов проходят все правила KO. Мы предполагаем, что из этих 26 тыс. Клиентов, согласно нашей модели CDM, уровень дефолта составит 1,15%.

На рисунках ниже показан процесс оптимизации. Мы видим, что многие из возможных решений исключаются, и только те, которые находятся на фронте Парето, распространяются дальше.

В конце процесса оптимизации мы получаем следующий набор решений.

Результатом процесса оптимизации является набор правил с разными значениями ограничений, которые нас волнуют, например, количество правил KO, количество приложений, проходящих эти правила, и ожидаемая частота по умолчанию для этих клиентов. Давайте внимательно рассмотрим результаты. Для результатов 1 и 2 мы видим, что хотя количество приложений меньше по сравнению с правилом 3, частота по умолчанию намного более приемлема по сравнению со скоростью по умолчанию в правиле 3. В целом мы видим, что можем увеличить число. кредитов, выданных на ~ 18%, уменьшают правила KO до 1 и лишь незначительно увеличивают уровень дефолта. Поскольку у нас есть набор правил, а не одно правило, бизнес-менеджеры могут выбрать решение, которое больше соответствует их аппетиту к риску, в этом случае они могут выбрать решение 1 с 2 правилами KO или решение 2 с 1 правилом KO. Полный код этого блога можно найти здесь.

Однако, как и все методы, NSGA-II также страдает некоторыми ограничениями.

Генетические алгоритмы по своей природе медленны в вычислении, поскольку они лежат где-то между грубой силой и аналитическим методом оптимизации. Как видно из рисунка ниже, для вычисления первых нескольких поколений требуется много времени по сравнению с последующими.

Не существует аналитического способа расчета критериев остановки. Хороший момент для остановки процесса оптимизации - это когда цели достигнуты или целевые функции не меняются непрерывно в течение многих поколений.
В случае, если есть много переменных, из-за стохастической природы мутаций результаты могут немного отличаться для каждого прогона, однако многократное выполнение процесса оптимизации и усреднение результатов должны дать стабильный набор результатов. В приведенном выше примере мы не столкнулись с этой проблемой.

Как видите, нам удалось сократить количество правил выбывания на 80-90%, увеличив при этом выдачу кредита на ~ 18%, при лишь незначительном увеличении ставки дефолта. Оптимизация с несколькими целями - это мощный метод, который можно использовать для решения широкого круга задач оптимизации, особенно когда у вас есть несколько конкурирующих целей.

Ссылки:

Код: «https://github.com/anilkumarpanda/kooptimiz Анастасия.

Разъяснение NSGA-II: http://oklahomaanalytics.com/data-science-techniques/nsga-ii-explained/

NSGA-II: https://www.youtube.com/watch?v=Hm2LK4vJzRw

Иконки Flaticon: https://www.flaticon.com/authors/eucalyp

Пакеты Python для эволюционной многоцелевой оптимизации:

pymoo: многоцелевая оптимизация в Python
Наша структура предлагает современные одно- и многоцелевые алгоритмы и многие другие функции, связанные с… pymoo. org

Документация DEAP - документация DEAP 1.3.1
DEAP - это новая эволюционная вычислительная среда для быстрого прототипирования и тестирования идей. Он стремится сделать… deap.readthedocs.io

* Набор данных получен из kaggle, а правила детонации созданы только для демонстрационных целей.

Оптимизация правил нокаута для кредитования

Вопросы по теме