Серия машинного обучения : Регрессия-1

Важным понятием в области машинного обучения является регрессия. Цель алгоритмов регрессии состоит в том, чтобы построить наиболее подходящую линию или кривую между представленными ей данными. На самом деле это метод контролируемого обучения, который может установить взаимосвязь между переменными, оценивая, как одна переменная влияет на другую. Чтобы узнать больше и подробные сведения о регрессии и ее использовании в машинном обучении, перейдите по этой ссылке,

Регрессионный анализ в машинном обучении
Регрессионный анализ — это статистический метод моделирования взаимосвязи между зависимым (целевым) и независимым…www.javatpoint.com

Лучший способ понять концепции регрессии и то, как она используется в машинном обучении, — это посмотреть на примеры. Если вы зайдете на сайт Scikit-Learn, вы увидите множество примеров различных алгоритмов машинного обучения.

Scikit-Learn.
«Мы используем scikit-learn для поддержки передовых фундаментальных исследований [...] Я думаю, что это самый хорошо разработанный пакет машинного обучения, который я когда-либо я…scikit-learn.org

Предпосылка

Прежде чем погрузиться в примеры программ, нам нужно установить в нашей системе следующее:

Питон 3+
Блокнот Юпитера
Scikit-Learn

Пример, который мы собираемся сделать, предоставлен scikit-learn. Посмотри и вернись.

Пример линейной регрессии — диабет
В приведенном ниже примере используется только первая функция набора данных о диабете, чтобы проиллюстрировать точки данных в…scikit-learn. орг

Scikit предоставляет набор данных о больных диабетом. Мы собираемся определить, как особенности в наборе данных влияют на прогрессирование заболевания, и, в свою очередь, предсказать, какие пациенты будут лучше реагировать на какие виды лечения.

Прежде всего нам нужно определить, какой тип алгоритма регрессии нам нужно использовать в нашем случае. Существуют различные типы алгоритмов регрессии.

Типы регрессий

Нам необходимо иметь общее представление о типах алгоритмов регрессии, чтобы понять, какой из них выбрать для нашей модели.

Линейная регрессия

Линейная регрессия показывает линейную связь между независимой переменной и зависимой переменной. Если есть только одна входная переменная, то это называется простой линейной регрессией. Если имеется более одной входной переменной, то это называется множественной линейной регрессией. Линейные регрессии очень хороши для поиска числовых значений.

Логистическая регрессия

Этот тип алгоритмов регрессии используется для решения задач классификации. Он хорошо работает с категориальными переменными, такими как 0 или 1, да или нет, спам или не спам и т. д.

Полиномиальная регрессия

Он моделирует нелинейные наборы данных, используя линейную модель. Если есть набор данных, состоящий из точек данных, которые имеют нелинейный характер, то используется полиномиальная регрессия, поскольку линейная регрессия не может наилучшим образом соответствовать этим точкам данных.

Опорная векторная регрессия

Алгоритмы машины опорных векторов можно использовать как для регрессии, так и для задач классификации. Регрессия опорных векторов — это алгоритм регрессии, который работает с непрерывными переменными.

Регрессия дерева решений

Алгоритмы этого типа могут использоваться для решения как категорийных, так и числовых данных. Он создает дерево, в котором каждый внутренний узел представляет «тест» для атрибута, каждая ветвь представляет результат теста, а каждый конечный узел представляет окончательное решение или результат. Набор деревьев решений приводит к случайному лесу, который является одним из самых мощных алгоритмов обучения с учителем, способным выполнять как регрессию, так и классификацию.

Пример диабета

Теперь перейдем к примеру: набор данных о диабете содержит 442 выборки данных о диабете с 10 переменными признаков. Поскольку мы имеем дело с числовыми данными и для простоты понимания регрессии, мы используем простую линейную регрессию для нашей модели.

Мы построили разбросанный график, показывающий взаимосвязь между прогрессированием заболевания и ИМТ, и другой разбросанный график, показывающий зависимость прогрессирования заболевания от артериального давления. Вы также можете попробовать другие функции набора данных.

Следующая часть серии,

Серия машинного обучения: регрессия-2 (визуализация данных)
Визуализация данных очень важна для понимания природы набора данных и проблемы, которую необходимо решить… среда.com

Ссылка,

ML-For-Beginners/2-Regression
В Северной Америке тыквам часто вырезают страшные лица на Хэллоуин. Давайте узнаем больше об этих увлекательных…github.com

Серия машинного обучения : Регрессия-1

Предпосылка

Типы регрессий

Пример диабета

Вопросы по теме