Важным понятием в области машинного обучения является регрессия. Цель алгоритмов регрессии состоит в том, чтобы построить наиболее подходящую линию или кривую между представленными ей данными. На самом деле это метод контролируемого обучения, который может установить взаимосвязь между переменными, оценивая, как одна переменная влияет на другую. Чтобы узнать больше и подробные сведения о регрессии и ее использовании в машинном обучении, перейдите по этой ссылке,



Лучший способ понять концепции регрессии и то, как она используется в машинном обучении, — это посмотреть на примеры. Если вы зайдете на сайт Scikit-Learn, вы увидите множество примеров различных алгоритмов машинного обучения.



Предпосылка

Прежде чем погрузиться в примеры программ, нам нужно установить в нашей системе следующее:

  1. Питон 3+
  2. Блокнот Юпитера
  3. Scikit-Learn

Пример, который мы собираемся сделать, предоставлен scikit-learn. Посмотри и вернись.



Scikit предоставляет набор данных о больных диабетом. Мы собираемся определить, как особенности в наборе данных влияют на прогрессирование заболевания, и, в свою очередь, предсказать, какие пациенты будут лучше реагировать на какие виды лечения.

Прежде всего нам нужно определить, какой тип алгоритма регрессии нам нужно использовать в нашем случае. Существуют различные типы алгоритмов регрессии.

Типы регрессий

Нам необходимо иметь общее представление о типах алгоритмов регрессии, чтобы понять, какой из них выбрать для нашей модели.

Линейная регрессия

Линейная регрессия показывает линейную связь между независимой переменной и зависимой переменной. Если есть только одна входная переменная, то это называется простой линейной регрессией. Если имеется более одной входной переменной, то это называется множественной линейной регрессией. Линейные регрессии очень хороши для поиска числовых значений.

Логистическая регрессия

Этот тип алгоритмов регрессии используется для решения задач классификации. Он хорошо работает с категориальными переменными, такими как 0 или 1, да или нет, спам или не спам и т. д.

Полиномиальная регрессия

Он моделирует нелинейные наборы данных, используя линейную модель. Если есть набор данных, состоящий из точек данных, которые имеют нелинейный характер, то используется полиномиальная регрессия, поскольку линейная регрессия не может наилучшим образом соответствовать этим точкам данных.

Опорная векторная регрессия

Алгоритмы машины опорных векторов можно использовать как для регрессии, так и для задач классификации. Регрессия опорных векторов — это алгоритм регрессии, который работает с непрерывными переменными.

Регрессия дерева решений

Алгоритмы этого типа могут использоваться для решения как категорийных, так и числовых данных. Он создает дерево, в котором каждый внутренний узел представляет «тест» для атрибута, каждая ветвь представляет результат теста, а каждый конечный узел представляет окончательное решение или результат. Набор деревьев решений приводит к случайному лесу, который является одним из самых мощных алгоритмов обучения с учителем, способным выполнять как регрессию, так и классификацию.

Пример диабета

Теперь перейдем к примеру: набор данных о диабете содержит 442 выборки данных о диабете с 10 переменными признаков. Поскольку мы имеем дело с числовыми данными и для простоты понимания регрессии, мы используем простую линейную регрессию для нашей модели.

Мы построили разбросанный график, показывающий взаимосвязь между прогрессированием заболевания и ИМТ, и другой разбросанный график, показывающий зависимость прогрессирования заболевания от артериального давления. Вы также можете попробовать другие функции набора данных.

Следующая часть серии,



Ссылка,