Матрица неточностей: обязательно для специалистов по анализу данных и инженеров по машинному обучению

Как использовать матрицу замешательства, чтобы желать

Матрица неточностей - это одна из таблиц, созданных для визуализации работы алгоритма или модели. Матрица путаницы в обучении необходима для понимания производительности вашей модели для тестирования или проверки данных. Это также известно как матрица ошибок.

Фактические значения и прогнозируемые значения отображаются в табличном формате с использованием матрицы неточностей. Если нужно предсказать более двух классов, будет очень сложно оценить значения. Итак, я ограничу это двумя классами, чтобы лучше понять. Я также не буду здесь играть с данными и значениями.

Термины, которые необходимо изучить, прежде чем углубляться в матрицу путаницы.

Истинно положительный: когда фактический класс равен 1, а модель также прогнозирует его как 1. Это будет считаться истинно положительным.

Ложное срабатывание: когда фактический класс равен 0, а прогноз модели - 1. Это будет рассматриваться как ложное срабатывание.

Истинно отрицательный: когда фактический класс равен 0, а модель прогнозирует его как 0. Это будет рассматриваться как истинно отрицательное.

Ложноотрицательный: когда фактический класс равен 1, а модель прогнозирует его как 0. Это будет рассматриваться как ложноотрицательное.

Во всех приведенных выше объяснениях 1 можно рассматривать как истинный класс, а 0 как отрицательный класс. Например: прогнозируемый дождь будет или нет, 1 - истинный класс, а 0 - отрицательный класс.

Чтобы упростить, мы можем сказать, что первое слово - это индикатор того, соответствует ли значение фактическому классу или нет. И второе слово - это индикатор значения, предсказанного обученной моделью. например: True Negative - Здесь отрицательный прогноз вашей модели, и он тоже правильный. Это упрощение будет легко запомнить и понять матрицу путаницы. Вы можете прийти с другим набором понимания, чтобы упростить задачу.

В приведенной выше таблице упомянуты только две тревожные ситуации. Это два места, где прогнозируемые модели отличаются от фактических значений. Это могло отличаться от случая к случаю. В случае медицинского или финансового использования FN действительно вызывает беспокойство, и обычно FP можно игнорировать. Больше внимания уделяется уменьшению количества ложноотрицательных результатов. FP также называется ошибкой типа I, а FN также называется ошибкой типа II.

Другая общая формула, рассчитываемая на основе значений, созданных в матрице неточностей:

Частота ошибок = (FP + FN) / (P + N)

Точность = (TP + TN) / (P + N)

Чувствительность (коэффициент отзыва или истинного положительного результата) = TP / P, где P = TP + FN, все фактические истинные

Специфичность (истинно отрицательная ставка) = TN / N, где N = TN + FP, все фактические отрицательные

Точность (положительное прогнозируемое значение / скорость) = TP / (TP + FP), где знаменатель - все прогнозируемые положительные результаты.

F-Score (среднее гармоническое значение точности и отзыва) = (1 + b) * (PREC.REC) / (b²PREC + REC), где b обычно составляет 0,5, 1, 2.

F- мера = (2 * отзыв * точность) / вызов + точность

Выше приведены некоторые важные формулы, используемые для оценки производительности модели. Матрица путаницы дает данные для оценки всех. Чем больше функций, тем больше расчетов, которые нужно выполнять вручную.

Ниже приведена ссылка ниже, где разработана модель дерева решений и код для визуализации матрицы путаницы.

Дерево решений - использование Python
Дерево решений - одна из самых простых и легких моделей для запуска. Это одна из самых простых известных моделей решения… medium.com

Матрица неточностей: обязательно для специалистов по анализу данных и инженеров по машинному обучению

Как использовать матрицу замешательства, чтобы желать

Вопросы по теме