Вопросы по теме 'nvcc'
Каковы значения по умолчанию для параметров архитектуры и кода при использовании nvcc?
При компиляции кода CUDA вы должны выбрать, для какой архитектуры создается ваш код. nvcc предоставляет два параметра для указания этой архитектуры, в основном:
arch указывает виртуальную архитектуру, которая может быть compute_10 ,...
7835 просмотров
schedule
06.11.2023
Передать переменную предварительной обработки в NVCC для компиляции CUDA?
Когда я компилирую свой код CUDA с NVCC, и я уже определил переменную предварительной обработки в коде, например. #define DEBUG_OUTPUT 0 , есть ли способ перезаписать такую переменную на лету при компиляции? Я попытался указать параметр NVCC...
1418 просмотров
schedule
17.03.2023
Cuda с Boost
В настоящее время я пишу приложение CUDA и хочу использовать boost:: program_options для получения необходимых параметров и пользовательского ввода.
Проблема, с которой я сталкиваюсь, заключается в том, что NVCC не может справиться с компиляцией...
6531 просмотров
schedule
18.03.2024
Проблемы со связью с объектным файлом, созданным с помощью cuda nvcc
Я пытаюсь создать ссылку на объектный файл, созданный NVCC. Вот очень простая "библиотека":
//foo.cu:
void foo() {
}
И файл, который использует "библиотеку":
//main.cu:
extern void foo();
int main(){
foo();
}
Обратите внимание, что...
1560 просмотров
schedule
31.03.2023
Ошибка CUDA 2.1: имя неизвестного типа 'size_t'
Система: Ubuntu 11.10 x86_64 CUDA: v 2.1
При попытке создать пример программы, такой как matrixMul, я получаю огромное количество ошибок, большинство из которых — «неизвестное имя типа 'size_t'». Я обязательно указал /usr/local/cuda/bin в своем...
12637 просмотров
schedule
04.06.2024
Как использовать cuPrintf с проектами cuda, которые имеют main() в файле .cpp?
Итак, я пытаюсь ускорить некоторый код обнаружения столкновений, который использует SDL для рисования некоторых сталкивающихся шаров на поверхности/окне в Mac OS X. Я уже могу выполнять столкновение и рисовать вещи последовательно. Я хотел бы иметь...
1359 просмотров
schedule
14.04.2022
Скажите NVCC, чтобы НЕ выполнялась предварительная обработка кода хоста, чтобы избежать переопределения BOOST_COMPILER.
У меня есть .cu-файл, содержащий код хоста и устройства:
// device code
__global__ void
myKernel() { ... }
// host code
#include <boost/thread/mutex.hpp>
boost::mutex myMutex;
int main() { ... }
Как видите, я включаю мьютекс-функции...
781 просмотров
schedule
20.06.2022
Установщик cuda toolkit 5.0 не создает nvcc bin
Я пытаюсь установить CUDA Toolkit 5.0 на Ubuntu 12.04. Я следил за всеми учебниками и нигде не могу найти свою проблему.
Я делаю все, что нужно (выключаю lightdm, создаю символическую ссылку на libglut, экспортирую пути..., как в...
170 просмотров
schedule
28.08.2022
Связывание динамического параллелизма CUDA
У меня есть GTX TITAN, на котором я бы использовал динамический параллелизм.
Я сделал несколько тестов, добавив «-rdc = true» и флаг «-lcudadevrt», но при компиляции всегда получаю ошибку компоновки.
Это мой Makefile:
DEP...
990 просмотров
schedule
31.08.2022
nvcc — разные размеры блоков в зависимости от архитектуры во время компиляции
У меня есть ядро, которое показывает максимальную производительность для различных размеров блоков при работе на оборудовании Kepler и Fermi. Я хотел бы во время компиляции проверить текущую цель архитектуры и определить макрос THREADS_PER_BLOCK...
242 просмотров
schedule
02.11.2023
Использование GHC с NVCC
В качестве альтернативы accelerate я пытаюсь вызвать код CUDA через FFI Haskell.
Вот простая программа, которая не компилируется:
cuda_code.cu:
void cuda_init() {
cudaFree (0);
cudaThreadSynchronize ();
}
Тест.hs:
foreign...
256 просмотров
schedule
08.08.2023
Смешайте компиляцию MPI и CUDA с динамическим параллелизмом
Я столкнулся с одной проблемой компиляции, когда хотел скомпилировать смешанную программу MPI + CUDA с поддержкой динамического параллелизма.
Исходный код dyn_pal.cu
#include <stdio.h>
#include <cuda.h>
#define N 100
#define M 32...
1847 просмотров
schedule
26.05.2023
Ошибка недопустимого символа устройства CUDA
приведенный ниже код компилируется просто отлично. Но когда я пытаюсь запустить его, я получаю
GPUassert: invalid device symbol file.cu 114
Когда я комментирую строки, отмеченные (!!!), ошибка не появляется. Мой вопрос в том, что вызывает...
14638 просмотров
schedule
29.07.2023
Компилятор CUDA предупреждает о нераспознанной прагме GCC
В файле CUDA есть некоторый код C++, который использует эту прагму:
#pragma GCC diagnostic push
#pragma GCC diagnostic ignored "-Wunused-result"
void foobar()
{
// some code
}
#pragma GCC diagnostic pop
Когда этот файл...
1292 просмотров
schedule
01.09.2023
Компиляция части программы C++ для GPU
Можно ли скомпилировать (C++) код для графического процессора с nvcc в общий объект (файл .so) и динамически загрузить его из программы C++ (в данном случае — файла Cern ROOT , который по существу является интерпретатором C++ ("CINT")) ....
1563 просмотров
schedule
17.07.2023
Компиляция библиотеки с cuda 7.0 с использованием nvcc в Windows при привязке к 32-битному python 2.5
Я пытаюсь скомпилировать библиотеку, которую можно вызывать из python с помощью nvcc. Обычно в Windows я использую цепочку инструментов msys/mingw и могу без проблем компилировать расширения Python. Однако, когда я пытаюсь скомпилировать с помощью...
566 просмотров
schedule
26.01.2023
Ошибка компиляции с nvcc и С++ 11, нужен минимальный неудачный пример
Следующий код (первоначально из Boost) не компилируется с использованием nvcc 7.0 с включенной поддержкой C++11:
#include <memory>
template<typename T>
struct result_of_always_void
{
typedef void type;
};
template<typename F,...
503 просмотров
schedule
16.12.2022
CUDA nvcc строит цепочку библиотек
Моя цель: library2.so использует library1.so , а mycode.o использует (библиотеки должны быть связаны) library2.so (и, возможно, library1.so ).
Исходный код (файлы заголовков одной строки опущены):
библиотека1.cu:
__device__ void...
2353 просмотров
schedule
02.09.2022
CUDA: забвение конфигурации запуска ядра не приводит к предупреждению или ошибке компилятора NVCC
Когда я пытаюсь вызвать ядро CUDA (функция __global__ ) с помощью указателя функции, все работает нормально. Однако, если я забуду предоставить конфигурацию запуска при вызове ядра, NVCC не приведет к ошибке или предупреждению, но программа...
637 просмотров
schedule
03.10.2022
Как получить текущие вычислительные возможности графического процессора из основной части кода?
Я пытался использовать __CUDA_ARCH__ , но где-то читал, что это работает только с частью кода, относящейся к устройству. После этого я наткнулся на этот код на github: ссылка
Есть ли лучший способ добиться этого?
Я спрашиваю об этом, потому...
240 просмотров
schedule
05.06.2022