Машина учится тому, как реагировать на заданные данные о проблеме, чтобы найти решение. Поскольку машина не знает об этих проблемах и решениях, мы обучаем машину для обучения (как компании обучают первокурсников или студентов колледжей) во время обучения. машина может не дать наилучших результатов напрямую, поэтому нам нужно оценить, насколько хороша машина для тренировочных данных (X, y). Таким образом, мы видим разницу между ожидаемым выходом y и произведенным машиной выходом yhat, как этот yhat-y, который показывает потери для данного обучающего примера. Поскольку нам нужно проверить его на обучающих данных, мы выполняем Sum for n обучающего набора данных,

Σ(i=1 to n) (yhati-yi)

поскольку разница может быть положительной или отрицательной, мы выберем абсолютное значение или квадрат

Σ(i=1 to n) (yhati-yi)^2

поскольку эта сумма варьируется в зависимости от количества обучающих примеров, мы возьмем среднее (или среднее), чтобы на нее не влияло n. (разделить на 2 для легкой математики, но не уверен в конкретной причине, если вы знаете, пожалуйста, добавьте в комментариях)

(1/2m) * Σ(i=1 to n) (yhati-yi)^2

Это значение называется функцией стоимости, так как оно показывает, сколько нам будет стоить убыток, если мы используем конкретную модель машинного обучения. Это обозначено буквой J. Наша цель во время обучения будет состоять в том, чтобы уменьшить эту стоимость, чтобы общие потери были минимальными для ожидаемого результата.

Это хорошо, но возникает больше вопросов: как узнать, высокая у меня стоимость или низкая, и как внести изменения в модель и достичь оптимального значения? Хорошо, если вы так думаете, давайте рассмотрим эту деталь в следующем блоге.