Как нормализовать изображение с помощью Octave?

В своей статье, описывающей систему обнаружения объектов Виолы-Джонса (надежная Распознавание лиц Виолы и Джонса), говорится:

Все примерные подокна, используемые для обучения, были нормализованы по дисперсии, чтобы свести к минимуму влияние различных условий освещения.

Мой вопрос: "Как реализовать нормализацию изображения в Octave?"

Я НЕ ищу конкретную реализацию, которую использовали Виола и Джонс, но похожую, которая дает почти такой же результат. Я следил за множеством руководств по обучению хаару (пытаясь обнаружить руку), но еще не смог вывести хороший детектор (xml).

Я пытался связаться с авторами, но до сих пор нет ответа.


person Koji Ikehara    schedule 18.12.2012    source источник


Ответы (1)


Я уже ответил, как это сделать в общих рекомендациях в этой теме.

Вот как выполнить метод 1 (нормализация к стандартному нормальному отклонению) в октаве (демонстрация для случайной матрицы A, конечно, может быть применена к любой матрице, как представлено изображение):

>>A = rand(5,5)
A =

   0.078558   0.856690   0.077673   0.038482   0.125593
   0.272183   0.091885   0.495691   0.313981   0.198931
   0.287203   0.779104   0.301254   0.118286   0.252514
   0.508187   0.893055   0.797877   0.668184   0.402121
   0.319055   0.245784   0.324384   0.519099   0.352954

>>s = std(A(:))
s =  0.25628
>>u = mean(A(:))
u =  0.37275
>>A_norn = (A - u) / s
A_norn =

  -1.147939   1.888350  -1.151395  -1.304320  -0.964411
  -0.392411  -1.095939   0.479722  -0.229316  -0.678241
  -0.333804   1.585607  -0.278976  -0.992922  -0.469159
   0.528481   2.030247   1.658861   1.152795   0.114610
  -0.209517  -0.495419  -0.188723   0.571062  -0.077241

В приведенном выше вы используете:

  • Чтобы получить стандартное отклонение матрицы: s = std(A(:))
  • Чтобы получить среднее значение матрицы: u = mean(A(:))
  • А затем по формуле A'[i][j] = (A[i][j] - u)/s с векторизованной версией: A_norm = (A - u) / s

Нормализация с помощью векторной нормализации тоже проста:

>>abs = sqrt((A(:))' * (A(:)))
abs =  2.2472
>>A_norm = A / abs
A_norm =

   0.034959   0.381229   0.034565   0.017124   0.055889
   0.121122   0.040889   0.220583   0.139722   0.088525
   0.127806   0.346703   0.134059   0.052637   0.112369
   0.226144   0.397411   0.355057   0.297343   0.178945
   0.141980   0.109375   0.144351   0.231000   0.157065

В приведенном выше:

  • abs — это абсолютное значение вектора (его длина), которое вычисляется с помощью векторизованного умножения (A(:)' * A(:) на самом деле sum(A[i][j]^2))
  • Затем мы используем его для нормализации вектора, чтобы он имел длину 1.
person amit    schedule 18.12.2012
comment
Привет! Я смог сделать это в Октаве. На выходе получается матрица со значениями от 0 до 2 (в зависимости от размера картинки, в моем случае 20 на 20). Но когда я попытался сохранить его с помощью ›imwrite(norm, output.pgm), картинка была вся черная. Есть предположения? Заранее спасибо! - person Koji Ikehara; 26.12.2012
comment
@KojiIkehara: Ожидается, что все будет черным, диапазон [0,2] довольно мал (низкие числа), и вы получите очень низкое видимое разнообразие. Эта обработка не делает изображение лучше для человека, это позволяет алгоритму лучше анализировать его. - person amit; 26.12.2012
comment
Привет! Спасибо! У меня есть еще один вопрос, вы знаете, использовали ли они все эти черные картинки в качестве необработанных данных для обучения? Или алгоритм позаботится об этом? - person Koji Ikehara; 07.01.2013