Сегодня я узнал о метриках ошибок машинного обучения.

Показатели ошибок

Метрика ошибок полезна, чтобы определить, лучше ли один алгоритм машинного обучения, чем другой. Чтобы лучше понять показатели ошибок, мы можем классифицировать прогнозы следующим образом.

Точность

Точность - это простейший показатель ошибок для машинного обучения. Мы можем просто судить, что алгоритм лучше, если он имеет более высокую точность.

Точность / отзыв

Однако точность не является хорошим показателем ошибки, если собранные данные искажены. Скажем, только 1% данных положительный (1). Предположим, наш алгоритм просто возвращает 0 99% времени и дает нам таблицу ниже. Это даст нам точность 98%, хотя, очевидно, это не лучший алгоритм.

Вот где пригодятся точность и отзывчивость. Точность определяет, сколько возвращенных совпадений являются положительными. Напомним, количество обнаруженных истинных положительных результатов.

В случае приведенного выше примера точность составляет 50%, а отзыв также составляет 50%. Высокая точность означает, что если прогноз положительный, высока вероятность, что оно действительно положительное. Высокая степень запоминания означает, что если прогноз отрицательный, высока вероятность, что оно на самом деле неверно.

Оценка F

Оценка F - это просто инструмент для сравнения двух наборов чисел точности / повторения.

На сегодня все.