У меня есть большой массив символов в глобальной памяти устройства, к которому потоки обращаются объединенным образом. Я где-то читал, что могу ускорить доступ к памяти, прочитав 4 или 16 символов в одной транзакции памяти на поток. Я считаю, что мне придется использовать текстуры и структуры char4 или int4. Однако я не могу найти никакой документации или примеров по этому поводу. Может ли кто-нибудь здесь привести простой пример или указать, где я могу узнать больше об этом?
В моем коде я определяю массив символов как
char *database = NULL;
cudaMalloc( (void**) &database, SIZE * sizeof(char) );
Каким будет определение, если я хочу использовать текстуры и char4 (или int4)?
Большое спасибо.