Жизнь как дорога. Мы встретимся с разными людьми и столкнемся с разными проблемами. Мы не всегда идем в одном и том же направлении, но обычно используем сходные тактики или решения, и при каждом повторении опыта у нас возникает одинаковая эмоциональная реакция. Если человек действительно действует повторяющимися способами, описанными выше, результирующий паттерн может соответствовать линейной регрессии, которая может предсказать его/ее будущее.

Прежде всего, что такое «линейная регрессия»? Линейная регрессия — это графический линейный подход к моделированию взаимосвязи между зависимой переменной (y) и одной или несколькими независимыми переменными (x). Случай одной независимой переменной (x) называется простой линейной регрессией. Для двух или более независимых переменных (x) процесс называется множественной линейной регрессией.

При моделировании значения зависимых переменных зависят от значений независимых переменных. Независимые переменные (x) представляют входные данные или причины, то есть потенциальные причины изменения. Эти переменные символизируют нашу академическую специальность, друзей, работу и т. д. Зависимые переменные представляют результат или результат, изменение которого изучается, например план жизни человека, в котором количество независимых переменных определяет значения зависимой переменной.

Основные приложения линейной регрессии делятся на две широкие категории: предсказание и объяснение. Здесь я хочу сосредоточиться на прогнозировании. Фактически, реальная жизнь применяет его для предсказания поведения людей. Например, банк будет решать, насколько высокие кредитные лимиты будут распространяться на человека, в зависимости от его или ее характеристик, таких как уровень образования, род занятий, потребительское поведение и т. д. Таким образом, ключевым моментом точности любой модели линейной регрессии, предсказывающей Модель зависит от того, насколько много мы действительно понимаем об этом человеке.

Возвращаясь к математике, взглянем на простую линейную регрессию. Прогнозы Y при построении графика как функции X образуют прямую линию. Поскольку множественная линейная регрессия включает в себя множество измерений, трудно нанести результаты на график.

Давайте посмотрим на следующие формулы:

В простой линейной регрессии зависимая переменная прогнозируется на основе одной независимой переменной. При множественной регрессии зависимая переменная предсказывается двумя или более независимыми переменными. Обратите внимание на βo в формуле; мы назвали βo параметром пересечения, который является константой. Его часто определяют как среднее значение зависимой переменной, когда мы устанавливаем все независимые переменные в нашей модели равными нулю, что означает, что значение пересекает ось Y на линии регрессии. Этот шаблон представляет собой неизменные части нашей жизни, такие как пол и семья.

Если цель модели линейной регрессии состоит в том, чтобы объяснить изменение переменной отклика, которое можно отнести к изменению независимых переменных, параметр пересечения становится почти бессмысленным. Почему? Это потому, что вы не можете контролировать начало жизни; более поздние элементы представляют собой независимые переменные, которые позже изменили внешний вид и структуру вашей жизни. Например, семья (параметр пересечения) имеет ограниченное влияние на личность человека. Однако после взросления такие элементы (независимые переменные), как общество, друзья, образование, профессия, на самом деле являются ключевыми моментами в воспитании человека.

Теперь взгляните на красную точку. Красная точка, отклоняющаяся от линии, представляет собой измеряемую переменную, которую мы назвали «у»; красная точка, соответствующая линии, — это прогнозируемое значение, которое мы назвали «ŷ». Ошибка прогноза для точки представляет собой значение измеряемой переменной минус прогнозируемое значение. Эта часть модели называется членом ошибки или членом возмущения, который охватывает все другие факторы, влияющие на зависимую переменную y, кроме независимых переменных x.

Подумайте об этом так: мы рассматриваем целые элементы, чтобы поместить их все в модели и понять каждую реакцию в любой ситуации, например, если он плачет, когда чувствует себя подавленным; он кричит, когда счастлив; он убегает, когда сталкивается с трудностями. Однако иногда элемент меняется случайно, например, когда он внезапно злится, когда расстроен; он спокоен, когда чувствует себя прекрасно; он начинает задавать вопросы, когда сталкивается с дилеммами. Ошибки больше, а точность модели снижается.

Итак, теперь, когда вы прочитали мой анализ, как вы думаете, возможно ли предсказать будущее человека с помощью линейной регрессии? Это не невозможно, но это непросто. Если большая часть поведения человека фиксирована, включая его реакцию на разные условия, круг общения, условия работы, то мы можем распознать закономерность, то точность модели линейной регрессии высока. Тем не менее, люди постепенно меняются на протяжении всей жизни. Когда в линейной регрессии больше ошибок, модель может быть уже не такой хорошей, как должна была быть.

Ссылки и дополнительная литература:

https://en.wikipedia.org/wiki/Зависимые_и_независимые_переменные

https://en.wikipedia.org/wiki/Линейная_регрессия

http://onlinestatbook.com/2/regression/intro.html

https://statisticsbyjim.com/regression/interpret-constant-y-intercept-regression/