Показатели оценки, используемые в регрессии

Это общие метрики оценки, используемые в задачах регрессии в машинном обучении:

Средняя абсолютная ошибка (MAE): MAE — это среднее абсолютных различий между прогнозируемыми и фактическими значениями. Он измеряет, насколько прогнозируемые значения в среднем отличаются от фактических значений. Чем ниже значение MAE, тем лучше производительность модели.
Среднеквадратическая ошибка (MSE): MSE — это среднее квадратов разностей между прогнозируемыми и фактическими значениями. Он измеряет, насколько прогнозируемые значения в среднем отличаются от фактических значений, но при этом больший вес придается большим ошибкам. Чем ниже значение MSE, тем лучше производительность модели.
Среднеквадратическая ошибка (RMSE): RMSE — это квадратный корень из MSE. Он измеряет то же, что и MSE, но в том же масштабе, что и исходные значения. RMSE часто используется для сравнения производительности различных моделей, поскольку он более интерпретируем, чем MSE.
R-квадрат (R2): R2 — это статистическая мера, представляющая долю дисперсии зависимой переменной, которая объясняется независимыми переменными в модели. Он варьируется от 0 до 1, где 1 указывает на идеальное соответствие, а 0 указывает на отсутствие соответствия. Чем выше значение R2, тем лучше производительность модели.

Как правило, хорошая регрессионная модель должна иметь низкие значения MAE, MSE и RMSE и высокое значение R2. Однако, как и в случае задач классификации, конкретная задача и приоритеты заинтересованных сторон могут определять, какой показатель наиболее важен для оптимизации.

Вот пример таблицы, в которой сравнивается производительность трех разных моделей регрессии на основе показателей MAE, MSE, RMSE и R2:

В этом примере модель B имеет самые низкие значения MAE, MSE и RMSE, что указывает на то, что это модель с лучшими характеристиками в целом. Однако модель А имеет самое высокое значение R2, что указывает на то, что она объясняет наибольшую дисперсию зависимой переменной. В зависимости от конкретной задачи и приоритетов заинтересованных сторон предпочтительной моделью может быть модель B или модель A.

Например, если задача состоит в прогнозировании цен на жилье, компания по недвижимости может отдавать предпочтение низким значениям RMSE, поскольку они хотят точно прогнозировать цены на недвижимость. С другой стороны, исследовательское исследование может отдавать приоритет высоким значениям R2, поскольку они хотят понять факторы, объясняющие колебания цен на жилье. В конечном итоге выбор метрики и предпочтительной модели будет зависеть от конкретного варианта использования и целей.

Показатели оценки, используемые в регрессии

Вопросы по теме