Прогнозирование заработной платы на основе многолетнего опыта

Введение

В этой статье показано, как менее чем за 5 минут построить простую модель линейной регрессии с градиентным спуском. Цель состоит в том, чтобы предсказать зависимую переменную (y) на основе независимой переменной (X).

Мы хотим спрогнозировать заработную плату с учетом многолетнего опыта.
Для этого мы объясним несколько концепций (градиентный спуск, линейная модель) и напишем 4 функции:

  • Функция прогнозирования: прогнозирование заработной платы на основе многолетнего опыта. (Лучшие коэффициенты B0 и B1 мы нашли благодаря градиентному спуску).
  • Функция стоимости: позволяет визуализировать ошибки стоимости для каждой итерации. Он использует среднеквадратичную ошибку (разницу между прогнозом и реальными значениями).
  • Градиентный спуск: найдите лучшие коэффициенты B0 и B1.
  • График печати: используется для отображения диаграмм рассеяния значений, предсказанных на основе модели, и реальных значений с помощью matplotlib.

После этого мы обучим нашу модель, используя скорость обучения.
Наконец, мы находим лучший коэффициент и прогнозируем новые значения, никогда не встречавшиеся в модели.

Понимание концепций

Линейная модель

В машинном обучении линейная модель представляет собой регрессионную модель, которая ищет взаимосвязь между независимой переменной (X) и зависимой переменной.

В этой статье мы углубимся в простую линейную регрессию (только с одной независимой переменной). Формула простой линейной регрессии:

y = B0 + B1x

y — переменная, которую мы хотим предсказать
x — независимая переменная (входная переменная)
B0 — это термин представляющий y, когда x = 0
B1 — коэффициент (вес), связанный с x.

Когда вы строите простую модель линейной регрессии, цель состоит в том, чтобы найти параметры B0 и B1. Чтобы найти лучшие параметры, мы используем градиентный спуск.

Представьте, что ваша модель обнаружила, что лучшими параметрами являются B0 = 10 и B1 = 12.
Если вы хотите спрогнозировать y