Слово «ипотека» на старофранцузском означает залог смерти, как в «этот долг ваш, пока вы не умрете». Хотя ипотека более гибкая, чем следует из ее корня, вы несете ответственность за погашение ссуды. Чтобы получить ипотеку, заемщик должен подать заявку на ее получение через учреждение, где кредитный специалист использует свою деловую хватку и опыт в предметной области для надлежащей оценки кредитного риска в зависимости от различных факторов человека.

К счастью, один из продуктов Finastra, известный как Mortgagebot, упрощает весь процесс ипотечного кредитования. Поскольку это уже работает, наша команда по инновациям предложила идею использования машинного обучения и искусственного интеллекта для прогнозирования вероятности одобрения ипотеки в качестве дополнительной функции платформы.

С одной стороны, мы хотим облегчить нагрузку на кредитного специалиста - рассмотрение каждой обширной заявки отнимает много времени. С другой стороны, мы хотим помочь нашим клиентам (финансовым учреждениям), увеличивая количество заявок на ипотеку, которые приводят к закрытым займам. Один из способов сделать это - показать клиентам мгновенную приблизительную скорость одобрения.

В то время как интеллект в значительной степени ассоциируется с человеческой чертой, революция в искусственном интеллекте связана с его способностью эффективно обнаруживать и иллюстрировать решение проблем, обучение, восприятие, рассуждение и закономерности. Стоит отметить, что вокруг искусственного интеллекта существует клеймо, особенно изображаемое в СМИ: подумайте о таких фильмах, как Ex Machina (2014) и Я, робот (2004) с участием Уилла Смита. . Люди, похоже, боятся ИИ или не хотят использовать его преимущества из-за неправильного представления о том, что люди будут заменены машинами. Однако, как показывает функция Mortgagebot, я считаю, что ИИ - это мощный инструмент, который люди могут использовать для улучшения своей работы и эффективного повышения производительности.

Одно из наиболее распространенных применений ИИ в производстве - это использование подхода, отличного от обычного бизнес-порядка, и влияния на альтернативные возможности - алгоритмы могут вникать в непредвиденные закономерности или прогнозы, чтобы повлиять на руководство компании в принятии правильных бизнес-решений на основе данных. В нашем случае с использованием Mortgagebot предположим, что организация постоянно имеет более низкий фактический уровень одобрения. Это может побудить учреждение скорректировать свое право на андеррайтинг, чтобы фильтры не были слишком строгими. Кроме того, когда заемщик одобрен для этого учреждения, они с меньшей вероятностью будут искать и подавать заявки на ссуды в других учреждениях. Мы надеемся, что учреждениям, которые вообще не предлагают онлайн-одобрение, оценка приблизительных показателей одобрения поможет им лучше понять, сколько заявок они могут одобрить. Это, в свою очередь, могло помочь их закрытым ставкам.

Я уверен, что вы знакомы с американским экономическим кризисом 2008 года, также известным как Великая рецессия, который во многом был вызван рынком жилья. Таким образом, мы хорошо понимаем, что в кредитных циклах есть холмы и спады. Поскольку новые данные об ипотеке в режиме реального времени постоянно передаются в базу данных, мы создали конвейер, который позволит автоматически переобучать модель. Это гарантирует, что наша модель адаптируется к колебаниям рынка и экономическим тенденциям, чтобы делать более точные прогнозы с течением времени.

Идея заключалась в том, чтобы атаковать разработку этой модели, рассматривая ее как проблему контролируемого обучения, поскольку данные, которые мы вводим в алгоритм, помечены - мы знаем, были ли отправленные заявки были одобрены или нет. Кроме того, это также задача двоичной классификации, потому что мы разделяем данные на две категории: отказы и утверждения.

Мы выполнили проектирование функций, то есть процесс выбора наших функций и их конструирования для точного представления поставленной задачи. Мы также провели статистические тесты, чтобы определить, какие функции будут более значимыми, чем другие. Некоторые из наших характеристик включали доход, отношение долга к доходу и ориентировочный кредитный рейтинг.

Наконец, пришло время выбрать алгоритм. Помня о том, что с учетом наших логистических ограничений и вычислительного времени построить идеальное дерево практически невозможно, мы построили несколько моделей и выбрали ту, которая дает наилучшие результаты. Мы экспериментировали с алгоритмами упаковки (Random Forest) и алгоритмами повышения (XGBoost, AdaBoost, Gradient Boosting, LightGBM). Нам нужна была универсальная модель, которая могла бы обрабатывать выбросы, несбалансированные данные, смещения и переобучения, в дополнение к быстрой работе и обработке огромных наборов данных с высокой размерностью.

В лаборатории инноваций Finastra мы в основном занимаемся проверкой концепций. Кто-то придет к нам, предоставит данные и скажет: «Привет, вот некоторые из наших данных. Как вы можете внедрить ML / AI, чтобы помочь нам работать лучше? » Мы обсудим некоторые варианты использования, а затем представим нашу работу вместе с нашими объяснениями и оценками, чтобы показать, возможно ли это и имеет ли какой-то потенциал, или есть ли у нас какие-либо проблемы. Если им это понравится, они предпримут необходимые шаги для внедрения в производство.

Нам посчастливилось увидеть, как наш проект Mortgagebot прошел весь путь от базовой разработки до производства. Мы работаем в рамках 90-дневных инновационных спринтов здесь, в Innovation Lab, что означает, что мы пытаемся перейти от 0 (концепция) до 100 (полностью разработанный результат) за 90 дней. Мы разработали модель за 3 дня в неделю с 8 июля, и она официально запущена 29 августа. В первый день у этой функции было 7 клиентов! Это было невероятным достижением не только для Innovation Lab и команды Mortgagebot, но и для всей компании: эта функция была первой реализацией ML / AI в производственной среде Finastra.

Вот несколько способов, которые мы изучаем, чтобы улучшить нашу модель. Рынки жилья и социально-экономические уровни варьируются от места к месту - рынок Нью-Йорка сильно отличается от рынка Де-Мойна, штат Айова. Однако наша текущая модель обучает только одну модель из всей базы данных приложений, поэтому учет геолокации может дать лучшее понимание. Еще одним усовершенствованием является создание конвейера, в котором каждое учреждение может также обучать / переобучать вторую модель, адаптированную для этого конкретного учреждения, поскольку требования, квалификация и предпочтения различаются в зависимости от учреждения.

Если вы хотите узнать больше о том, какие инструменты мы использовали для построения и реализации модели, см. Подробности в этом сообщении блога здесь!

Спасибо за чтение!