Введение

В этом посте я расскажу об одном из самых важных методов регрессионного анализа/машинного обучения, называемом линейной регрессией. Согласно Википедии, регрессионный анализ определяется как набор статистических процессов, используемых для оценки силы связи между зависимой переменной и независимой переменной. Процесс, который пытается оценить эту силу связи, предполагая линейное поведение между зависимой и независимой переменной, называется линейной регрессией. Проще говоря, в линейной регрессии мы пытаемся оценить связь между независимыми переменными (также называемыми функциями) и зависимой переменной (также называемой целевой переменной), предполагая линейную связь.

Предположения линейной регрессии

Существует пять допущений, связанных с моделью линейной регрессии:

  1. Линейность: связь между независимой переменной и средним значением зависимой переменной является линейной.
  2. Гомоскедастичность: дисперсия остатка одинакова для любого значения независимой переменной.
  3. Независимость: наблюдения независимы друг от друга.
  4. Нормальность: для любого фиксированного значения как зависимая, так и независимая переменная нормально распределены.
  5. Нет автокорреляции: не должно быть корреляции между текущими и прошлыми значениями независимой переменной.

Далее мы поговорим об основах линейной регрессии.

Основы линейной регрессии

В этом разделе мы обсудим математику, лежащую в основе линейной регрессии. Когда у нас есть только одна независимая переменная, она называется простой линейной регрессией или одномерной линейной регрессией и определяется как

В приведенном выше уравнении y1 представляет цель (зависимую переменную), xi представляет собой независимую переменную, 𝜷1 представляет вес или коэффициент независимая переменная, а 𝜷0 представляет член смещения или, проще говоря, точку пересечения линейного уравнения.

Если у нас есть более двух независимых переменных, то линейная регрессия называется многомерной линейной регрессией. Приведенное выше уравнение также можно обобщить для многомерной линейной регрессии. Это дается,

Заключение

Итак, в этой статье мы обсудили основы линейной регрессии. Если вы хотите погрузиться в глубины линейной регрессии и увидеть ее реализацию с нуля на наборе данных, вы можете сделать это здесь.

Надеюсь, вы найдете мой пост информативным. Я регулярно размещаю материалы Data Science в своем блоге. Если вы хотите связаться со мной, не стесняйтесь делать это через LinkedIn. Спасибо за чтение и счастливого обучения !!!!



Предложения по подаче заявок на Mlearning.ai
Как стать писателем на Mlearning.aimedium.com