Фото Charles Deluvio на Unsplash

1. Функция затрат. (Понимание и расчет функции затрат.)

В машинном обучении линейная регрессия - один из наиболее часто используемых алгоритмов. Функция затрат и Градиентный спуск образуют модель линейной регрессии.

Что такое функция затрат?

Функции затрат используются для оценки того, насколько плохо работают модели, то есть для измерения производительности модели машинного обучения для заданных данных.

Это достигается путем количественной оценки ошибки между прогнозируемыми и ожидаемыми значениями и представления их в виде действительного числа.

Вот пример таблицы данных с ее графиком:

В таблице ниже приведены примеры значений гипотез. Учитывая гипотезы, наша цель - найти линию, которая наилучшим образом соответствует приведенному выше графику. (Это пример контролируемого обучения)

Глядя на график ниже, можно легко определить возможную линию наилучшего соответствия. (образец данных1). Однако, будучи инженерами, мы должны не просто гадать, а тщательно анализировать.

Следовательно, используя формулу функции стоимости, давайте вычислим и попытаемся предсказать наилучшую линию соответствия для заданных значений.

Вот формула:

Попробуем понять, что означает формула:

m означает количество выборок или наборов данных.

Обозначение сигма относится к суммированию от i до m.

Далее функция:

Относится к разнице между значением гипотезы h (x) и фактическим значением y, а затем вы возводите разницу в квадрат.

К расчету:

Пример данных1

m = 2 (обратите внимание, что нам предоставили два набора данных для гипотез)

so 1/2m = 1/4

Далее нам просто нужно найти разницу и квадрат, т.е.

So:

  • (2.2–2.0) ^ 2 = 0.04
  • (3.3–3.5) ^ 2 = 0.04
  • (4.8–4.5) ^ 2 = 0.09

Затем суммируем результаты и умножаем на ¼, чтобы получить: 0,0425.

Пример данных2

Мы делаем тот же расчет, где:

  • (2.8–2.0) ^ 2 = 0.64
  • (4–3.5) ^ 2 = 0.25
  • (4.2–4.5) ^ 2 = 0.09

Затем суммируем и умножаем на 1/4

Отсюда результат: 0,245.

Самая низкая стоимость является наиболее желательной, поскольку, минимизируя стоимость, мы фактически находим наиболее подходящий вариант.

Самая низкая стоимость означает наименьшую разницу, поэтому, согласно нашим данным, Выборочные данные1 имеют наименьшую стоимость (0,0425), следовательно, это лучшая линия соответствия.

Глядя на график, мы действительно видим, что Sample data1 имеет наилучшее соответствие.

И это наглядное объяснение того, как рассчитать функцию затрат!

Важные дополнительные моменты:

  • Функция стоимости также называется функцией квадратов ошибок ( поэтому мы берем квадрат ошибок).
  • Это также называется среднеквадратичной ошибкой.
  • Цель модели машинного обучения - найти параметры, веса или структуру, которая минимизирует стоимость функции. Это делается с помощью алгоритма градиентного спуска (о котором мы узнаем позже).

Заключение

В этом посте объясняется очень простой способ понимания функции затрат, который очень важен для продвижения концепций машинного обучения!