мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН.
У меня есть изображение в градациях серого (рассмотрите пример ниже), и в моем алгоритме мне нужно добавить только столбцы.
Как я могу загрузить четыре 8-битных значения пикселей параллельно, которые являются uint8_t, как четыре uint32_t в один из 128-битных регистров NEON ? Какой внутренний я должен использовать, чтобы сделать это?
Я имею в виду:
Я должен загрузить их как 32-битные, потому что, если вы посмотрите внимательно, момент, когда я делаю 255 + 255, составляет 512, что не может храниться в 8-битном регистре.
e.g.
255 255 255 255 ......... (640 pixels)
255 255 255 255
255 255 255 255
255 255 255 255
.
.
.
.
.
(480 pixels)