Я сделал программу CUDA для 2D-свертки и теперь хочу сравнить ее с какой-либо реализацией, отличной от CUDA, чтобы измерить ускорение.
Я мог бы сравнить с моей собственной реализацией на простом C, используя классический подход с несколькими циклами или conv2 от Matlab, но это не похоже на законное/справедливое сравнение, поскольку они не являются самыми быстрыми реализациями.
Также я думал о том, чтобы попробовать OpenCV, и я безуспешно искал версию, оптимизированную для SIMD. Любой совет, я должен пойти с OpenCV?
ПРИМЕЧАНИЕ. Я читал другие вопросы, в том числе этот, но ответ в основном так же, как мой простой код C или обсуждение различных доступных методов.