Вопросы по теме 'cublas'

CUBLAS работает непредсказуемо
Написал свою первую программу с использованием CUDA+CUBLAS. Он просто использует функцию «cublasDgemm» и вычисляет произведение 2 матриц N*N. Однако все время, пока я запускал свою программу, она продолжала выдавать один и тот же неверный ответ...
2071 просмотров
schedule 23.04.2024

cublas cublasZgemm() медленнее, чем ожидалось
Согласно nvidia . cublasZgemm в 6 раз быстрее, чем Intel MKL. Однако на моем ПК (i7 2600, Nvidia gtx560, ОС: Linux 64bit) cublasZgemm немного медленнее, чем MKL. Я использую numpy.dot(), который поставляется с дистрибутивом enthought python ,...
431 просмотров
schedule 05.02.2023

Можно ли вызвать функцию CUDA CUBLAS из глобальной функции или функции устройства
Я пытаюсь распараллелить существующее приложение, у меня большая часть приложения распараллелена и работает на графическом процессоре, у меня возникают проблемы с переносом одной функции на графический процессор В функции используется функция...
1627 просмотров
schedule 23.07.2023

Будут ли функции ядра cublas автоматически синхронизироваться с хостом?
Просто общий вопрос о cublas. Для одного потока, если нет передачи памяти от графического процессора к центральному процессору (например, cublasGetVector), будут ли функции ядра cublas (например, cublasDgemm) автоматически синхронизироваться с...
792 просмотров
schedule 20.06.2022

cuBLAS argmin segfault при выводе в память устройства?
В cuBLAS cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции: cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result)...
897 просмотров
schedule 19.04.2023

Каков наиболее эффективный способ транспонирования матрицы в CUDA?
У меня есть матрица памяти хоста M*N , и при копировании в память устройства мне нужно, чтобы она транспонировалась в матрицу N*M . Есть ли какой-нибудь API cuda (cuBLAS...) для этого? Я использую CUDA 4. Спасибо!
7216 просмотров
schedule 11.06.2023

Как подключить библиотеку cublas в eclipse Nsight?
Я использую пример кода Nvidia для simpleCUBLAS. Пример поставляется с Makefile, или я могу скомпилировать его следующим образом: g++ -m32 -I/usr/local/cuda/include -I. -o simpleCUBLAS.o -c simpleCUBLAS.cc g++ -m32 -o simpleCUBLAS simpleCUBLAS.o...
5993 просмотров
schedule 24.02.2023

Можно ли также использовать входные матрицы для хранения выходной матрицы с помощью CUBLAS?
Например, cublas<t>geam() подойдет: Но что, если я все равно хочу сохранить результат в A ? Могу ли я вызвать его с помощью указателей *C = *A , чтобы: не опасаясь, что я могу писать вывод в матрицу, которая все еще...
108 просмотров
schedule 17.02.2023

Как настроить аргументы функции cublas {t} symm ()
Эта функция выполняет симметричное матричное умножение с использованием CUDA. Хотя мне удалось использовать несимметричную версию "cublas {t} gemm ()", я не смог правильно использовать функцию "cublas {t} symm ()". Я знаю, что библиотека CUBLAS...
1077 просмотров
schedule 31.05.2022

как сделать мощность комплексного числа в CUBLAS?
Я переношу свой код С++ на CUDA и CUBLAS. Я использую stl::complex для сложных вычислений (например, pow, log, exp и т. д.), но я не видел тех же функций, определенных в библиотеке CuComplex. Я не знаю, как создавать эти функции, но я нашел...
1675 просмотров
schedule 10.01.2023

Есть ли функция cuda для копирования строки из матрицы в основной столбец?
У меня есть матрица устройств U размеров MxN в основном порядке столбцов. Теперь я хотел бы извлечь строку K в вектор u. Есть ли функция для этого? Обратите внимание, что копия должна учитывать смещение K и шаг M. Я смотрел на функцию...
1497 просмотров
schedule 29.04.2022

cubasSetVector() против cudaMemcpy()
Мне интересно, есть ли разница между: // cumalloc.c - Create a device on the device HOST float * cudamath_vector(const float * h_vector, const int m) { float *d_vector = NULL; cudaError_t cudaStatus; cublasStatus_t cublasStatus;...
1550 просмотров
schedule 11.07.2022

Ошибка компоновщика неразрешенных символов при попытке инициализировать cublas
Я кодирую на VS2013 с установленным набором инструментов CUDA 6.5. Сегодня попробовал использовать cublas. Я пробовал разные методы инициализации, и ни один из них не работал: 1) #include <cuda_runtime.h> #include "cublas.h" int...
221 просмотров
schedule 02.01.2023

Theano: сбой cublasSgemm (14) сбой внутренней операции
Иногда, через некоторое время нормального запуска, я получаю такую ​​ошибку с Theano/CUDA: RuntimeError: cublasSgemm failed (14) an internal operation failed unit=0 N=0, c.dims=[512 2048], a.dim=[512 493], alpha=%f, beta=%f, a=%p, b=%p, c=%p...
909 просмотров
schedule 18.04.2023

Ошибка компиляции cublasSgetriBatched с CUDA 7.0 Release Candidate
Рассмотрим код, размещенный sgarizvi на CUBLAS: неправильная инверсия для матрицы с нулевой точкой поворота Я использую этот код как готовый репродуктор моей проблемы. Если я скомпилирую его с помощью CUDA 6.0, все будет работать нормально....
317 просмотров
schedule 18.06.2022

Ошибка CUBLAS после выполнения cublasSgemmBatched
В моем коде CUDA/C++ я хочу умножить матрицу A (собранную из матриц 1 * 2) на матрицу F (2 * 2) и получить результат. Для этого я использовал функцию cublasSgemmBatched. Но всякий раз, когда я пытаюсь получить результат (используя cublasGetMatrix)...
148 просмотров
schedule 13.04.2022

Как реализовать умножение плотной x блочно-диагональной матрицы в CUDA?
Предположим, у вас есть плотная матрица размером 1500x500, и вам нужно умножить ее на блочно-диагональную матрицу размером 500x500, которая состоит из десяти субматриц размером 50x50, расположенных по диагонали: S 0 ... 0 0 0 S 0 0 ... 0 0 ......
605 просмотров
schedule 01.08.2022

Как выполнить продукт Адамара с CUBLAS на комплексных числах?
Мне нужно вычислить поэлементное умножение двух векторов (произведение Адамара) комплексных чисел с помощью NVidia CUBLAS. К сожалению, в CUBLAS нет операции HAD. По-видимому, это можно сделать с помощью операции SBMV, но для комплексных чисел в...
1595 просмотров
schedule 19.05.2022

Неверный результат при вызове cublasSgemm с помощью кода хоста C
Я получаю странные числа в ответ на вызов библиотечной функции cuBLAS cublasSgemm из кода хоста C. Он компилируется и запускается, но числа в результирующей матрице неверны. Проблема с вызовом этих функций в основном коде C заключается в том, что...
476 просмотров
schedule 09.05.2023

cublasDasum и cublasDnrm2 завершают работу программы без каких-либо ошибок или вывода
Я работаю над функцией, чтобы найти p-норму матрицы, используя cuda и cublas. При этом чаще всего используются 1-норма, 2-норма и Инф-норма. Эти три просто означают следующее для матрицы с элементами [x1, x2, x3, ..., xn] 1-норма = абс(х1) +...
49 просмотров
schedule 13.07.2023