Введение
В этом посте я расскажу об одном из самых важных методов регрессионного анализа/машинного обучения, называемом линейной регрессией. Согласно Википедии, регрессионный анализ определяется как набор статистических процессов, используемых для оценки силы связи между зависимой переменной и независимой переменной. Процесс, который пытается оценить эту силу связи, предполагая линейное поведение между зависимой и независимой переменной, называется линейной регрессией. Проще говоря, в линейной регрессии мы пытаемся оценить связь между независимыми переменными (также называемыми функциями) и зависимой переменной (также называемой целевой переменной), предполагая линейную связь.
Предположения линейной регрессии
Существует пять допущений, связанных с моделью линейной регрессии:
- Линейность: связь между независимой переменной и средним значением зависимой переменной является линейной.
- Гомоскедастичность: дисперсия остатка одинакова для любого значения независимой переменной.
- Независимость: наблюдения независимы друг от друга.
- Нормальность: для любого фиксированного значения как зависимая, так и независимая переменная нормально распределены.
- Нет автокорреляции: не должно быть корреляции между текущими и прошлыми значениями независимой переменной.
Далее мы поговорим об основах линейной регрессии.
Основы линейной регрессии
В этом разделе мы обсудим математику, лежащую в основе линейной регрессии. Когда у нас есть только одна независимая переменная, она называется простой линейной регрессией или одномерной линейной регрессией и определяется как
В приведенном выше уравнении y1 представляет цель (зависимую переменную), xi представляет собой независимую переменную, 𝜷1 представляет вес или коэффициент независимая переменная, а 𝜷0 представляет член смещения или, проще говоря, точку пересечения линейного уравнения.
Если у нас есть более двух независимых переменных, то линейная регрессия называется многомерной линейной регрессией. Приведенное выше уравнение также можно обобщить для многомерной линейной регрессии. Это дается,
Заключение
Итак, в этой статье мы обсудили основы линейной регрессии. Если вы хотите погрузиться в глубины линейной регрессии и увидеть ее реализацию с нуля на наборе данных, вы можете сделать это здесь.
Надеюсь, вы найдете мой пост информативным. Я регулярно размещаю материалы Data Science в своем блоге. Если вы хотите связаться со мной, не стесняйтесь делать это через LinkedIn. Спасибо за чтение и счастливого обучения !!!!