Когда вы работаете с задачами компьютерного зрения, вы должны выбрать метод измерения сходства между двумя изображениями, чтобы сравнить разные результаты ваших экспериментов. Давайте рассмотрим различные методы в этой заметке.

Самый традиционный метод оценки - это среднеквадратичная ошибка (MSE). MSE измеряет среднеквадратичную разницу между оценочными значениями (предсказанными значениями) и фактическими значениями (истинными значениями). Итак, мы просто вычисляем квадрат разницы пиксель за пикселем. Но это работает хорошо только в том случае, если мы хотим создать изображение с наилучшим соответствием цветов пикселей с исходным изображением. Иногда мы хотим сосредоточиться на структуре или рельефе изображения.

PSNR (отношение пикового сигнала к шуму) - вторая традиционная оценка. Чтобы использовать этот оценщик, мы должны преобразовать все значения представления пикселей в битовую форму. Если у нас 8-битные пиксели, то значения каналов пикселей должны быть от 0 до 255. Кстати, для PSNR лучше всего подходит цветовая модель красный, зеленый, синий или RGB. PSNR показывает соотношение между максимально возможной мощностью сигнала и мощностью искажающего шума, которое влияет на точность его представления. PSNR часто используется для контроля качества передачи цифрового сигнала.

Но PSNR является разновидностью MSE и по-прежнему концентрируется на сравнении пикселей. Рассмотрим метод структурного подобия (SSIM). SSIM коррелирует с качеством и восприятием зрительной системы человека (цветовая модель HVS). Вместо использования традиционных методов суммирования ошибок SSIM моделирует искажение изображения как комбинацию трех факторов: потеря корреляции, искажение яркости и искажение контрастности.

Некоторые исследования показали, что в отличие от SSIM, MSE и PSNR плохо справляются с распознаванием структурного содержимого в изображениях, поскольку различные типы ухудшения, применяемые к одному и тому же изображению, могут давать одинаковое значение MSE. Другие исследования показали, что MSE и, следовательно, PSNR, обладают лучшими характеристиками при оценке качества зашумленных изображений.
___________
Ресурсы:
Лу, Инцзин. «Потеря структурного подобия, взвешенная по уровню: шаг в сторону от MSE». Труды конференции AAAI по искусственному интеллекту. Vol. 33. 2019
Хор, Ален и Джемель Зиу. «Метрики качества изображения: PSNR против SSIM». 2010 20-я Международная конференция по распознаванию образов. IEEE, 2010 г.