Модели машинного обучения

1. Модели машинного обучения можно разделить на следующие две категории на основе алгоритма обучения:

  • Метод контролируемого обучения. Для построения модели доступны прошлые данные с ярлыками.
  • Регрессия. Выходная переменная по своей природе непрерывна.
  • Классификация. Выходная переменная является категориальной по своей природе.
  • Метод обучения без учителя. Прошлые данные с ярлыками недоступны.
  • Кластеризация. Не существует предопределенного понятия ярлыков.

Прошлый набор данных разделен на две части в методе контролируемого обучения:

  • Обучающие данные используются для обучения модели во время моделирования.
  • Данные тестирования используются обученной моделью для прогнозирования и оценки модели.
  1. Модели линейной регрессии можно разделить на два типа в зависимости от количества независимых переменных:
  • Простая линейная регрессия. Используется, когда число независимых переменных равно 1.

  • Множественная линейная регрессия: используется, когда количество независимых переменных больше 1.
  1. Уравнение наиболее подходящей линии регрессии Y = β₀ + β₁X можно найти путем минимизации функции стоимости (в данном случае RSS с использованием обычного метода наименьших квадратов), которая выполняется с использованием следующих двух методов:
  • Дифференциация
  • Градиентный спуск
  1. Сила модели линейной регрессии в основном объясняется R², гдеR² = 1 — (RSS/TSS).
  • RSS: Остаточная сумма квадратов
  • TSS: общая сумма квадратов
  1. RSE помогает измерить несоответствие модели заданным данным. Близость рассчитанных коэффициентов регрессии к истинным можно оценить с помощью RSE. Это связано с RSS по формуле: RSE=√RSSdf, где df=n−2, а n — количество точек данных.