Вопросы по теме 'fma'
FMA3 в GCC: как включить
У меня i5-4250U с AVX2 и FMA3. Я тестирую код умножения плотных матриц в GCC 4.8.1 на Linux, который я написал. Ниже приведен список из трех разных способов компиляции.
SSE2: gcc matrix.cpp -o matrix_gcc -O3 -msse2 -fopenmp
AVX: gcc...
14723 просмотров
schedule
21.05.2022
Объединенные режимы умножения, сложения и округления по умолчанию
В GCC 5.3 следующий код компилируется с -O3 -fma
float mul_add(float a, float b, float c) {
return a*b + c;
}
производит следующую сборку
vfmadd132ss %xmm1, %xmm2, %xmm0
ret
Я заметил, что GCC делает это с -O3 уже в GCC 4.8 ....
1975 просмотров
schedule
10.06.2023
CUDA половинные операции с плавающей запятой без явных встроенных функций
Я использую CUDA 11.2 и использую тип __half для выполнения операций с 16-битными значениями с плавающей запятой.
Я удивлен, что компилятор nvcc не будет должным образом вызывать инструкции с плавным умножением, когда я это делаю:
__half...
88 просмотров
schedule
26.08.2022