Основная цель функции стоимости – свести к минимуму количество ошибок при прогнозировании целевых значений. Как мы знаем, окончательный результат функции стоимости в основном зависит от того, какие значения Θ мы выбираем изначально.

Ниже приведена формула функции стоимости, ее необходимые параметры и то, как она будет работать с гипотезой или линией регрессии.

Цель функции стоимости состоит в том, чтобы определить, для каких значений Θ прогнозируемые значения приближаются к фактическим целевым значениям с максимальной частотой ошибок.

Например, давайте попробуем взять несколько случайных значений Θ и посмотрим, как это повлияет на прогнозирование значений.

если m = 1, b = 0, то функция стоимости абсолютно равна нулю, что означает, что прогнозируемое значение h (x) и фактические значения Y одинаковы. Для этого нет частоты ошибок, это прогнозирование значений со 100% точностью. мы можем видеть, что линия регрессии проходит через фактические целевые значения без какого-либо отклонения от любого значения.

Давайте рассмотрим другой сценарий для лучшего понимания.

Но если m = 0,5, b = 0, то функция стоимости предсказывает целевые значения с некоторой ошибкой, и эта ошибка представляет собой не что иное, как «синюю линию» от фактических целевых значений до линии регрессии.

Но если оба значения Θ равны нулю, то функция стоимости предсказывает целевые значения с «максимальной ошибкой», и эта ошибка представляет собой не что иное, как «синюю линию», проведенную от фактических целевых значений к оси X.

В результате мы можем изобразить это; чем меньше функция стоимости, тем меньше будут значения ошибки, выше точность прогноза и наоборот.

Наконец, на изображении ниже показано, что если мы продолжим изменять значения Θ, положение линии линейной регрессии будет меняться до тех пор, пока не будет достигнуто наилучшее соответствие с наименьшей частотой ошибок, что даст вам точные прогнозы. В результате линия регрессии цвета морской волны дает прогнозы с минимальной частотой ошибок. Поэтому мы называем ее «Линия регрессии наилучшего соответствия» среди трех других линий регрессии.

Задумывались ли вы когда-нибудь, что брать значения Θ вручную так сложно для человека, поскольку он имеет бесконечное количество значений для Θ. Поэтому для нашего удобства мы используем алгоритм функции стоимости Gradient Descent для автоматического обновления значений Θ.