Четкая интуиция Log-Loss

Потеря журнала является одним из наиболее важных показателей классификации, которые оценивают эффективность задачи классификации. получить правильную интуицию о потере журнала с первой попытки может показаться непостижимой. Но здесь я попытался дать вам суть того, что такое потеря журнала, здесь я не пытаюсь копаться в математическом ожидании потери журнала.

Давайте сначала начнем с того, что на самом деле означает потеря журнала !!

Это показатель того, насколько близка вероятность предсказания к соответствующему фактическому / истинному значению. Алгоритмы двоичной классификации сначала прогнозируют вероятность того, что запись будет отнесена к классу 1, а затем классифицируют точку данных (запись) по одному из двух классов ( 1 или 0) в зависимости от того, пересекла ли вероятность пороговое значение, которое по умолчанию обычно равно 0,5.

Это среднее значение отрицательного журнала (вероятность правильной метки класса).

Пример

Модель предсказывает вероятность [0.8, 0.4, 0.1] для трех домов. Первые два дома были проданы, а последний не продан. Таким образом, фактические результаты могут быть представлены в числовом виде как [1, 1, 0].

Давайте рассмотрим эти прогнозы по одному, чтобы итеративно вычислить функцию правдоподобия.

Продан первый дом, и модель сказала, что вероятность этого составляет 80%. Таким образом, функция правдоподобия после просмотра одного прогноза равна 0,8.

Второй дом был продан, и модель сказала, что вероятность этого составляет 40%. Существует правило вероятности, что вероятность нескольких независимых событий является произведением их индивидуальных вероятностей. Итак, мы получаем объединенную вероятность из первых двух прогнозов, умножая связанные с ними вероятности. Это 0.8 * 0.4, что составляет 0,32.

Теперь мы подошли к нашему третьему предсказанию. Этот дом не продавался. В модели говорилось, что вероятность ее продажи составляет 10%. Это означает, что вероятность того, что он не будет продан, составляет 90%. Таким образом, согласно модели, наблюдаемый результат не продавать имел 90% -ную вероятность. Итак, умножаем предыдущий результат 0,32 на 0,9.

Мы могли пройти через все наши прогнозы. Каждый раз мы находили вероятность, связанную с фактическим результатом, и умножали ее на предыдущий результат. Это вероятность.

От вероятности до потери журнала

Каждое предсказание находится в диапазоне от 0 до 1. Если вы умножите достаточное количество чисел в этом диапазоне, результат станет настолько маленьким, что компьютеры не смогут его отследить. Итак, в качестве хитроумного вычислительного трюка мы вместо этого ведем журнал вероятности. Это диапазон, который легко отслеживать. Мы умножаем это на отрицательную единицу, чтобы сохранить общее мнение, что чем меньше балл, тем лучше.

Математическая формула

1 ›Здесь значение« p »находится между« 1 »и« 0 ».

2 ›Чем меньше, тем лучше: чем меньше величина потери журнала, тем лучше наша модель.

3 ›Используется, когда у нас есть оценка вероятности.

Удачного машинного обучения 🤓🤓 !!!

Четкая интуиция Log-Loss

Пример

От вероятности до потери журнала

Математическая формула

Вопросы по теме