Гарвин Ли

Примечание. Данные в этой статье являются вымышленными и используются только в экспериментальных целях.

Выдача сельскохозяйственных кредитов — типичный случай интеллектуального анализа данных. Кредиторы используют модель опыта, построенную на основе статистики прошлых лет (включая годовой доход заемщика, типы посаженных культур, кредитную историю и другие факторы), чтобы предсказать платежеспособность этого заемщика.

Этот документ основан на сценариях сельскохозяйственных кредитов и показывает, как использовать алгоритм линейной регрессии для управления бизнесом по выдаче кредитов.

Линейная регрессия — это широко применимый метод статистического анализа, используемый в статистике для определения количественного отношения, от которого зависят две или более переменных. В этой статье прогнозируется, следует ли выдавать запрошенные суммы кредита пользователям в наборе прогнозов, анализируя информацию об истории выдачи сельскохозяйственных кредитов. Весь анализ данных мы будем проводить на платформе Alibaba Cloud Machine Learning.

Введение в набор данных

Конкретные поля следующие:

Ниже приведен скриншот данных.

Процедура исследования данных

На следующей диаграмме показан процесс эксперимента.

1. Подготовка источника данных

Входные данные разделены на две части:

  1. Набор для обучения кредитов: более 200 фрагментов данных по кредитам используются для обучения регрессионной модели. Этот обучающий набор включает в себя такие функции, как «размер фермы» и «осадки». «Исковая стоимость» — это возмещенная сумма кредита.
  2. Набор прогнозов по кредитам: этот набор прогнозов включает в общей сложности 71 кандидата на получение кредита в этом году. «Стоимость требования» — это запрошенная фермером сумма кредита.

Укажите, кто из 71 заявителя получит кредит на основе существующих более 200 исторических данных.

2. Предварительная обработка данных

Сопоставьте данные строкового типа с числами в соответствии со значениями данных. Например, для поля «регион» сопоставьте «север», «середина» и «юг» в порядке 0, 1 и 2 соответственно, а затем преобразуйте поле в тип double с помощью компонента преобразования типа, как показано на следующей диаграмме. Вы можете выполнять обучение модели после предварительной обработки данных.

3. Обучение модели и прогнозирование

Используйте компоненты линейной регрессии для обучения данных истории и создания регрессионной модели, которая используется в компоненте прогнозирования для прогнозирования данных в наборе прогнозов. Используйте компонент слияния столбцов, чтобы объединить идентификатор пользователя, оценку прогноза и значение утверждения, как показано на следующем снимке экрана.

Оценка прогноза указывает на способность пользователя погашать кредит (ожидаемая сумма погашения кредита).

4. Оценка регрессионной модели

Используйте компонент оценки регрессионной модели, чтобы оценить модель. В следующей таблице описаны результаты оценки.

5. Выдача кредита

Используйте компоненты фильтрации и сопоставления, чтобы определить кандидатов, которые могут получить кредит. Принцип эксперимента заключается в том, что, если платежеспособность заявителя превышает запрашиваемую сумму кредита, этот заявитель получит кредит. Этот принцип распространяется на каждого потенциального клиента.

Чтобы узнать больше об облачной платформе машинного обучения Alibaba для искусственного интеллекта (PAI), посетите сайт www.alibabacloud.com/product/machine-learning.

Ссылка: https://www.alibabacloud.com/blog/alibaba-cloud-machine-learning-platform-for-ai-using-regression-algorithm-to-predict-agriculture-loan-issuing_594398?spm=a2c41.12531971.0 .0