Публикации по теме cublas

Вопросы по теме 'cublas'

Написал свою первую программу с использованием CUDA+CUBLAS. Он просто использует функцию «cublasDgemm» и вычисляет произведение 2 матриц N*N. Однако все время, пока я запускал свою программу, она продолжала выдавать один и тот же неверный ответ...

2071 просмотров

cuda cublas

23.04.2024

cublas cublasZgemm() медленнее, чем ожидалось

Согласно nvidia . cublasZgemm в 6 раз быстрее, чем Intel MKL. Однако на моем ПК (i7 2600, Nvidia gtx560, ОС: Linux 64bit) cublasZgemm немного медленнее, чем MKL. Я использую numpy.dot(), который поставляется с дистрибутивом enthought python ,...

431 просмотров

python cuda ctypes cublas

05.02.2023

Можно ли вызвать функцию CUDA CUBLAS из глобальной функции или функции устройства

Я пытаюсь распараллелить существующее приложение, у меня большая часть приложения распараллелена и работает на графическом процессоре, у меня возникают проблемы с переносом одной функции на графический процессор В функции используется функция...

1627 просмотров

cuda cublas

23.07.2023

Будут ли функции ядра cublas автоматически синхронизироваться с хостом?

Просто общий вопрос о cublas. Для одного потока, если нет передачи памяти от графического процессора к центральному процессору (например, cublasGetVector), будут ли функции ядра cublas (например, cublasDgemm) автоматически синхронизироваться с...

792 просмотров

cublas

20.06.2022

cuBLAS argmin segfault при выводе в память устройства?

В cuBLAS cublasIsamin() дает argmin для массива с одинарной точностью. Вот полное объявление функции: cublasStatus_t cublasIsamin(cublasHandle_t handle, int n, const float *x, int incx, int *result)...

897 просмотров

gpu cuda cublas blas gpgpu

19.04.2023

Каков наиболее эффективный способ транспонирования матрицы в CUDA?

У меня есть матрица памяти хоста M*N , и при копировании в память устройства мне нужно, чтобы она транспонировалась в матрицу N*M . Есть ли какой-нибудь API cuda (cuBLAS...) для этого? Я использую CUDA 4. Спасибо!

7216 просмотров

cuda cublas

11.06.2023

Как подключить библиотеку cublas в eclipse Nsight?

Я использую пример кода Nvidia для simpleCUBLAS. Пример поставляется с Makefile, или я могу скомпилировать его следующим образом: g++ -m32 -I/usr/local/cuda/include -I. -o simpleCUBLAS.o -c simpleCUBLAS.cc g++ -m32 -o simpleCUBLAS simpleCUBLAS.o...

5993 просмотров

eclipse cuda cublas

24.02.2023

Можно ли также использовать входные матрицы для хранения выходной матрицы с помощью CUBLAS?

Например, cublas<t>geam() подойдет: Но что, если я все равно хочу сохранить результат в A ? Могу ли я вызвать его с помощью указателей *C = *A , чтобы: не опасаясь, что я могу писать вывод в матрицу, которая все еще...

108 просмотров

c cuda cublas gpgpu

17.02.2023

Как настроить аргументы функции cublas {t} symm ()

Эта функция выполняет симметричное матричное умножение с использованием CUDA. Хотя мне удалось использовать несимметричную версию "cublas {t} gemm ()", я не смог правильно использовать функцию "cublas {t} symm ()". Я знаю, что библиотека CUBLAS...

1077 просмотров

cuda multiplication cublas symmetric

31.05.2022

как сделать мощность комплексного числа в CUBLAS?

Я переношу свой код С++ на CUDA и CUBLAS. Я использую stl::complex для сложных вычислений (например, pow, log, exp и т. д.), но я не видел тех же функций, определенных в библиотеке CuComplex. Я не знаю, как создавать эти функции, но я нашел...

1675 просмотров

cuda cublas

10.01.2023

Есть ли функция cuda для копирования строки из матрицы в основной столбец?

У меня есть матрица устройств U размеров MxN в основном порядке столбцов. Теперь я хотел бы извлечь строку K в вектор u. Есть ли функция для этого? Обратите внимание, что копия должна учитывать смещение K и шаг M. Я смотрел на функцию...

1497 просмотров

cuda cublas

29.04.2022

cubasSetVector() против cudaMemcpy()

Мне интересно, есть ли разница между: // cumalloc.c - Create a device on the device HOST float * cudamath_vector(const float * h_vector, const int m) { float *d_vector = NULL; cudaError_t cudaStatus; cublasStatus_t cublasStatus;...

1550 просмотров

cuda cublas

11.07.2022

Ошибка компоновщика неразрешенных символов при попытке инициализировать cublas

Я кодирую на VS2013 с установленным набором инструментов CUDA 6.5. Сегодня попробовал использовать cublas. Я пробовал разные методы инициализации, и ни один из них не работал: 1) #include <cuda_runtime.h> #include "cublas.h" int...

221 просмотров

cuda cublas

02.01.2023

Theano: сбой cublasSgemm (14) сбой внутренней операции

Иногда, через некоторое время нормального запуска, я получаю такую ошибку с Theano/CUDA: RuntimeError: cublasSgemm failed (14) an internal operation failed unit=0 N=0, c.dims=[512 2048], a.dim=[512 493], alpha=%f, beta=%f, a=%p, b=%p, c=%p...

909 просмотров

cuda theano cublas

18.04.2023

Ошибка компиляции cublasSgetriBatched с CUDA 7.0 Release Candidate

Рассмотрим код, размещенный sgarizvi на CUBLAS: неправильная инверсия для матрицы с нулевой точкой поворота Я использую этот код как готовый репродуктор моей проблемы. Если я скомпилирую его с помощью CUDA 6.0, все будет работать нормально....

317 просмотров

cuda cublas

18.06.2022

Ошибка CUBLAS после выполнения cublasSgemmBatched

В моем коде CUDA/C++ я хочу умножить матрицу A (собранную из матриц 1 * 2) на матрицу F (2 * 2) и получить результат. Для этого я использовал функцию cublasSgemmBatched. Но всякий раз, когда я пытаюсь получить результат (используя cublasGetMatrix)...

148 просмотров

c++ cuda cublas

13.04.2022

Как реализовать умножение плотной x блочно-диагональной матрицы в CUDA?

Предположим, у вас есть плотная матрица размером 1500x500, и вам нужно умножить ее на блочно-диагональную матрицу размером 500x500, которая состоит из десяти субматриц размером 50x50, расположенных по диагонали: S 0 ... 0 0 0 S 0 0 ... 0 0 ......

605 просмотров

matrix cuda diagonal cublas

01.08.2022

Как выполнить продукт Адамара с CUBLAS на комплексных числах?

Мне нужно вычислить поэлементное умножение двух векторов (произведение Адамара) комплексных чисел с помощью NVidia CUBLAS. К сожалению, в CUBLAS нет операции HAD. По-видимому, это можно сделать с помощью операции SBMV, но для комплексных чисел в...

1595 просмотров

gpu nvidia cuda cublas

19.05.2022

Неверный результат при вызове cublasSgemm с помощью кода хоста C

Я получаю странные числа в ответ на вызов библиотечной функции cuBLAS cublasSgemm из кода хоста C. Он компилируется и запускается, но числа в результирующей матрице неверны. Проблема с вызовом этих функций в основном коде C заключается в том, что...

476 просмотров

c matrix cuda cublas

09.05.2023

cublasDasum и cublasDnrm2 завершают работу программы без каких-либо ошибок или вывода

Я работаю над функцией, чтобы найти p-норму матрицы, используя cuda и cublas. При этом чаще всего используются 1-норма, 2-норма и Инф-норма. Эти три просто означают следующее для матрицы с элементами [x1, x2, x3, ..., xn] 1-норма = абс(х1) +...

49 просмотров

cuda nvcc cublas

13.07.2023