Прогнозирование заработной платы на основе многолетнего опыта
Введение
В этой статье показано, как менее чем за 5 минут построить простую модель линейной регрессии с градиентным спуском. Цель состоит в том, чтобы предсказать зависимую переменную (y) на основе независимой переменной (X).
Мы хотим спрогнозировать заработную плату с учетом многолетнего опыта.
Для этого мы объясним несколько концепций (градиентный спуск, линейная модель) и напишем 4 функции:
- Функция прогнозирования: прогнозирование заработной платы на основе многолетнего опыта. (Лучшие коэффициенты B0 и B1 мы нашли благодаря градиентному спуску).
- Функция стоимости: позволяет визуализировать ошибки стоимости для каждой итерации. Он использует среднеквадратичную ошибку (разницу между прогнозом и реальными значениями).
- Градиентный спуск: найдите лучшие коэффициенты B0 и B1.
- График печати: используется для отображения диаграмм рассеяния значений, предсказанных на основе модели, и реальных значений с помощью matplotlib.
После этого мы обучим нашу модель, используя скорость обучения.
Наконец, мы находим лучший коэффициент и прогнозируем новые значения, никогда не встречавшиеся в модели.
Понимание концепций
Линейная модель
В машинном обучении линейная модель представляет собой регрессионную модель, которая ищет взаимосвязь между независимой переменной (X) и зависимой переменной.
В этой статье мы углубимся в простую линейную регрессию (только с одной независимой переменной). Формула простой линейной регрессии:
y = B0 + B1x
y — переменная, которую мы хотим предсказать
x — независимая переменная (входная переменная)
B0 — это термин представляющий y, когда x = 0
B1 — коэффициент (вес), связанный с x.
Когда вы строите простую модель линейной регрессии, цель состоит в том, чтобы найти параметры B0 и B1. Чтобы найти лучшие параметры, мы используем градиентный спуск.
Представьте, что ваша модель обнаружила, что лучшими параметрами являются B0 = 10 и B1 = 12.
Если вы хотите спрогнозировать y…