Линейная регрессия и ее математическая реализация

Продолжим наше обучение

Чтобы понять линейную регрессию, сначала мы должны знать

Что такое регрессия?

Регрессия — это метод моделирования целевого значения на основе независимых предикторов. Этот метод в основном используется для прогнозирования и выяснения причинно-следственных связей между переменными.

Что такое ЛИНЕЙНАЯ регрессия?

Линейная регрессия — это алгоритм машинного обучения.
Он основан на контролируемом обучении.
Линейная регрессия — это тип регрессионного анализа, в котором количество независимых переменных (x) и зависимая переменная (y) имеют линейную связь между собой.

ВИДЫ ЛИНЕЙНОЙ РЕГРЕССИИ

Линейная регрессия обычно подразделяется на два типа:
1 — простая линейная регрессия.
2 — множественная линейная регрессия.

ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ

Простая линейная регрессия используется для оценки взаимосвязи междудвумя количественными переменными.

Математические формулы простой линейной регрессии

где
yr=зависимая переменная/вектор отклика/выход
yp=прогнозируемый отклик
x=независимая переменная/вектор признаков/вход
b=смещение/вес/пересечение
c=cofficeint от x

Найдя наилучшие значения b и c, модель получает наилучшую аппроксимирующую линию регрессии.

На приведенном выше рисунке показана линия наилучшего соответствия для набора данных «SalaryData».

В этом наборе данных у нас есть две функции, т. е. YearsExperience и Salary, и наша линейная модель прогнозирует заработную плату как результат при вводе данных в виде многолетнего опыта.

Множественная линейная регрессия

В мультилинейной регрессии у нас есть более одного вектора признаков или мы можем иметь две или более независимых переменных.

Объясненное выше уравнение множественной регрессии принимает следующий вид:

y = b1x1 + b2x2 + … + bnxn + c.

Цель регрессии состоит в том, чтобы определить значения весов 𝑏₁,𝑏₂,..bn, чтобы этот y был как можно ближе к фактическому ответу.

ФУНКЦИЯ СТОИМОСТИ:
Достигая наилучшей линии регрессии, модель стремится предсказать значение y таким образом, чтобы разница ошибок между прогнозируемым значением и истинным значением была минимальной.
Итак, очень важно обновить значения b и c, чтобы достичь наилучшего значения, которое минимизирует ошибку между предсказанным значением y и истинным значением y.

ГРАДИЕНТНЫЙ СПУСК:

Процесс оптимизации значений коэффициентов путем итеративной минимизации ошибки модели на ваших обучающих данных называется градиентным спуском. Сумма квадратов ошибок вычисляется для каждой пары входных и выходных значений. Скорость обучения используется в качестве коэффициента масштабирования, а коэффициенты обновляются в направлении минимизации ошибки. Процесс повторяется до тех пор, пока не будет достигнута минимальная сумма квадратов ошибок или дальнейшее улучшение невозможно.

Вот и подходит к концу эта статья.

РЕЗЮМЕ:

В этой статье я пытаюсь объяснить -

Что такое регрессия?
Что такое ЛИНЕЙНАЯ регрессия?
ВИДЫ ЛИНЕЙНОЙ РЕГРЕССИИ
ПРОСТАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
МНОЖЕСТВЕННАЯ ЛИНЕЙНАЯ РЕГРЕССИЯ
Математическая реализация линейной регрессии.
Что такое функция затрат?
Что такое градиентный спуск?

СПАСИБО ЗА ВАШЕ ЦЕННОЕ ВРЕМЯ

Линейная регрессия и ее математическая реализация

Вопросы по теме