Здравствуйте, читатели, я Хемант, энтузиаст науки о данных. Сегодня я собираюсь показать вам, как построить модель линейной регрессии.

Набор данных, который мы собираемся использовать, находится в ссылке kaggle.



Приступаем к кодированию. Сначала нам нужно импортировать все необходимые библиотеки

Прочитайте данные и распечатайте первые 5 строк набора данных.

Как видите, в наборе данных 7 столбцов, и мы в основном собираемся сосредоточиться только на столбцах «Вес» и «Рост».

Создайте отдельный фрейм данных с этими двумя столбцами.

Как известно, рост и вес прямо пропорциональны друг другу.
Теперь посмотрим на корреляцию визуально

Диаграмма рассеяния ясно показывает корреляцию между данными.

Теперь целевой переменной является Вес. Мы попробуем предсказать вес по заданному росту

Прежде чем мы приступим к обучению модели, мы должны разделить наши данные, чтобы убедиться, что модель не переоснащена.

Теперь давайте создадим модель и поместим в нее данные.

Давайте визуализируем модель прогнозирования набора данных для обучения и тестирования.

Набор обучающих данных

Набор тестовых данных

Точность набора тестовых данных

Что ж, мы достигли около 67 процентов достоверности. С помощью Feature Engineering мы можем сделать модель более точной. И я покажу это в следующем рассказе о множественной линейной регрессии.

Спасибо, что дочитали до конца. Следите за новыми уроками по машинному обучению и науке о данных!!!!!