Линейная регрессия — довольно простой алгоритм машинного обучения. Если мы будем классифицировать дальше, это алгоритм обучения под наблюдением, который используется для прогнозирования результата с некоторыми помеченными данными.
«Линейная регрессия» — это метод, который прогнозирует целевую переменную, находя линию наилучшего соответствия между независимой и зависимой переменной. Линия наилучшего соответствия - это минимальная ошибка из всех заданных точек.
Способ поиска наилучшего соответствия:
Метод наименьших квадратов является наиболее подходящим и простым для построения этой модели. Давайте обсудим математическую процедуру метода LS.
Метод наименьших квадратов.Линия наилучшего соответствия будет рассчитана таким образом, чтобы сумма всех расстояний между фигурой и фактическими наблюдениями в каждой точке была как можно меньше. Вот шаги ниже:
1-й шаг: вычислить среднее значение значений x и y, в частности.
2-й шаг: вычислить наклон линии.
3-й шаг: вычислить точку пересечения линии по оси y.
Давайте посчитаем факторы на простом примере простых данных:
Нанесение точек:
Расчет среднего значения:
Расчет наклона линии:
Вычислите y-перехват:
Нахождение уравнения прямой:
Здесь мы нашли наиболее подходящую линию, и с ее помощью мы можем легко предсказать значения.
Эта модель очень проста и легка в реализации. Он помогает прогнозировать числовые значения, но не может прогнозировать нелинейные переменные. Итак, если нам дали набор данных линейного типа, мы просто реализуем эту модель, чтобы получить наилучшие возможные результаты прогнозирования.