Вопросы по теме 'cublas'
CUBLAS работает непредсказуемо
Написал свою первую программу с использованием CUDA+CUBLAS. Он просто использует функцию «cublasDgemm» и вычисляет произведение 2 матриц N*N.
Однако все время, пока я запускал свою программу, она продолжала выдавать один и тот же неверный ответ...
2071 просмотров
schedule
23.04.2024
cublas cublasZgemm() медленнее, чем ожидалось
Согласно nvidia . cublasZgemm в 6 раз быстрее, чем Intel MKL.
Однако на моем ПК (i7 2600, Nvidia gtx560, ОС: Linux 64bit) cublasZgemm немного медленнее, чем MKL.
Я использую numpy.dot(), который поставляется с дистрибутивом enthought python ,...
431 просмотров
schedule
05.02.2023
Можно ли вызвать функцию CUDA CUBLAS из глобальной функции или функции устройства
Я пытаюсь распараллелить существующее приложение, у меня большая часть приложения распараллелена и работает на графическом процессоре, у меня возникают проблемы с переносом одной функции на графический процессор
В функции используется функция...
1627 просмотров
schedule
23.07.2023
Будут ли функции ядра cublas автоматически синхронизироваться с хостом?
Просто общий вопрос о cublas. Для одного потока, если нет передачи памяти от графического процессора к центральному процессору (например, cublasGetVector), будут ли функции ядра cublas (например, cublasDgemm) автоматически синхронизироваться с...
792 просмотров
schedule
20.06.2022
cuBLAS argmin segfault при выводе в память устройства?
В cuBLAS cublasIsamin() дает argmin для массива с одинарной точностью.
Вот полное объявление функции: cublasStatus_t cublasIsamin(cublasHandle_t handle, int n,
const float *x, int incx, int *result)...
897 просмотров
schedule
19.04.2023
Каков наиболее эффективный способ транспонирования матрицы в CUDA?
У меня есть матрица памяти хоста M*N , и при копировании в память устройства мне нужно, чтобы она транспонировалась в матрицу N*M . Есть ли какой-нибудь API cuda (cuBLAS...) для этого? Я использую CUDA 4. Спасибо!
7216 просмотров
schedule
11.06.2023
Как подключить библиотеку cublas в eclipse Nsight?
Я использую пример кода Nvidia для simpleCUBLAS. Пример поставляется с Makefile, или я могу скомпилировать его следующим образом:
g++ -m32 -I/usr/local/cuda/include -I. -o simpleCUBLAS.o -c simpleCUBLAS.cc g++ -m32 -o simpleCUBLAS simpleCUBLAS.o...
5993 просмотров
schedule
24.02.2023
Можно ли также использовать входные матрицы для хранения выходной матрицы с помощью CUBLAS?
Например, cublas<t>geam() подойдет:
Но что, если я все равно хочу сохранить результат в A ? Могу ли я вызвать его с помощью указателей *C = *A , чтобы:
не опасаясь, что я могу писать вывод в матрицу, которая все еще...
108 просмотров
schedule
17.02.2023
Как настроить аргументы функции cublas {t} symm ()
Эта функция выполняет симметричное матричное умножение с использованием CUDA. Хотя мне удалось использовать несимметричную версию "cublas {t} gemm ()", я не смог правильно использовать функцию "cublas {t} symm ()".
Я знаю, что библиотека CUBLAS...
1077 просмотров
schedule
31.05.2022
как сделать мощность комплексного числа в CUBLAS?
Я переношу свой код С++ на CUDA и CUBLAS. Я использую stl::complex для сложных вычислений (например, pow, log, exp и т. д.), но я не видел тех же функций, определенных в библиотеке CuComplex. Я не знаю, как создавать эти функции, но я нашел...
1675 просмотров
schedule
10.01.2023
Есть ли функция cuda для копирования строки из матрицы в основной столбец?
У меня есть матрица устройств U размеров MxN в основном порядке столбцов. Теперь я хотел бы извлечь строку K в вектор u. Есть ли функция для этого? Обратите внимание, что копия должна учитывать смещение K и шаг M.
Я смотрел на функцию...
1497 просмотров
schedule
29.04.2022
cubasSetVector() против cudaMemcpy()
Мне интересно, есть ли разница между:
// cumalloc.c - Create a device on the device
HOST float * cudamath_vector(const float * h_vector, const int m)
{
float *d_vector = NULL;
cudaError_t cudaStatus;
cublasStatus_t cublasStatus;...
1550 просмотров
schedule
11.07.2022
Ошибка компоновщика неразрешенных символов при попытке инициализировать cublas
Я кодирую на VS2013 с установленным набором инструментов CUDA 6.5. Сегодня попробовал использовать cublas. Я пробовал разные методы инициализации, и ни один из них не работал:
1)
#include <cuda_runtime.h>
#include "cublas.h"
int...
221 просмотров
schedule
02.01.2023
Theano: сбой cublasSgemm (14) сбой внутренней операции
Иногда, через некоторое время нормального запуска, я получаю такую ошибку с Theano/CUDA:
RuntimeError: cublasSgemm failed (14) an internal operation failed
unit=0 N=0, c.dims=[512 2048], a.dim=[512 493], alpha=%f, beta=%f, a=%p, b=%p, c=%p...
909 просмотров
schedule
18.04.2023
Ошибка компиляции cublasSgetriBatched с CUDA 7.0 Release Candidate
Рассмотрим код, размещенный sgarizvi на
CUBLAS: неправильная инверсия для матрицы с нулевой точкой поворота
Я использую этот код как готовый репродуктор моей проблемы.
Если я скомпилирую его с помощью CUDA 6.0, все будет работать нормально....
317 просмотров
schedule
18.06.2022
Ошибка CUBLAS после выполнения cublasSgemmBatched
В моем коде CUDA/C++ я хочу умножить матрицу A (собранную из матриц 1 * 2) на матрицу F (2 * 2) и получить результат. Для этого я использовал функцию cublasSgemmBatched. Но всякий раз, когда я пытаюсь получить результат (используя cublasGetMatrix)...
148 просмотров
schedule
13.04.2022
Как реализовать умножение плотной x блочно-диагональной матрицы в CUDA?
Предположим, у вас есть плотная матрица размером 1500x500, и вам нужно умножить ее на блочно-диагональную матрицу размером 500x500, которая состоит из десяти субматриц размером 50x50, расположенных по диагонали:
S 0 ... 0 0
0 S 0 0
...
0 0 ......
605 просмотров
schedule
01.08.2022
Как выполнить продукт Адамара с CUBLAS на комплексных числах?
Мне нужно вычислить поэлементное умножение двух векторов (произведение Адамара) комплексных чисел с помощью NVidia CUBLAS. К сожалению, в CUBLAS нет операции HAD. По-видимому, это можно сделать с помощью операции SBMV, но для комплексных чисел в...
1595 просмотров
schedule
19.05.2022
Неверный результат при вызове cublasSgemm с помощью кода хоста C
Я получаю странные числа в ответ на вызов библиотечной функции cuBLAS cublasSgemm из кода хоста C. Он компилируется и запускается, но числа в результирующей матрице неверны.
Проблема с вызовом этих функций в основном коде C заключается в том, что...
476 просмотров
schedule
09.05.2023
cublasDasum и cublasDnrm2 завершают работу программы без каких-либо ошибок или вывода
Я работаю над функцией, чтобы найти p-норму матрицы, используя cuda и cublas. При этом чаще всего используются 1-норма, 2-норма и Инф-норма. Эти три просто означают следующее для матрицы с элементами [x1, x2, x3, ..., xn]
1-норма = абс(х1) +...
49 просмотров
schedule
13.07.2023