Вопросы по теме 'fma'

FMA3 в GCC: как включить
У меня i5-4250U с AVX2 и FMA3. Я тестирую код умножения плотных матриц в GCC 4.8.1 на Linux, который я написал. Ниже приведен список из трех разных способов компиляции. SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp AVX: gcc...
14723 просмотров
schedule 21.05.2022

Объединенные режимы умножения, сложения и округления по умолчанию
В GCC 5.3 следующий код компилируется с -O3 -fma float mul_add(float a, float b, float c) { return a*b + c; } производит следующую сборку vfmadd132ss %xmm1, %xmm2, %xmm0 ret Я заметил, что GCC делает это с -O3 уже в GCC 4.8 ....
1975 просмотров
schedule 10.06.2023

CUDA половинные операции с плавающей запятой без явных встроенных функций
Я использую CUDA 11.2 и использую тип __half для выполнения операций с 16-битными значениями с плавающей запятой. Я удивлен, что компилятор nvcc не будет должным образом вызывать инструкции с плавным умножением, когда я это делаю: __half...
88 просмотров