Вопросы по теме 'nvcc'

Каковы значения по умолчанию для параметров архитектуры и кода при использовании nvcc?
При компиляции кода CUDA вы должны выбрать, для какой архитектуры создается ваш код. nvcc предоставляет два параметра для указания этой архитектуры, в основном: arch указывает виртуальную архитектуру, которая может быть compute_10 ,...
7835 просмотров
schedule 06.11.2023

Передать переменную предварительной обработки в NVCC для компиляции CUDA?
Когда я компилирую свой код CUDA с NVCC, и я уже определил переменную предварительной обработки в коде, например. #define DEBUG_OUTPUT 0 , есть ли способ перезаписать такую ​​переменную на лету при компиляции? Я попытался указать параметр NVCC...
1418 просмотров
schedule 17.03.2023

Cuda с Boost
В настоящее время я пишу приложение CUDA и хочу использовать boost:: program_options для получения необходимых параметров и пользовательского ввода. Проблема, с которой я сталкиваюсь, заключается в том, что NVCC не может справиться с компиляцией...
6531 просмотров
schedule 18.03.2024

Проблемы со связью с объектным файлом, созданным с помощью cuda nvcc
Я пытаюсь создать ссылку на объектный файл, созданный NVCC. Вот очень простая "библиотека": //foo.cu: void foo() { } И файл, который использует "библиотеку": //main.cu: extern void foo(); int main(){ foo(); } Обратите внимание, что...
1560 просмотров
schedule 31.03.2023

Ошибка CUDA 2.1: имя неизвестного типа 'size_t'
Система: Ubuntu 11.10 x86_64 CUDA: v 2.1 При попытке создать пример программы, такой как matrixMul, я получаю огромное количество ошибок, большинство из которых — «неизвестное имя типа 'size_t'». Я обязательно указал /usr/local/cuda/bin в своем...
12637 просмотров
schedule 04.06.2024

Как использовать cuPrintf с проектами cuda, которые имеют main() в файле .cpp?
Итак, я пытаюсь ускорить некоторый код обнаружения столкновений, который использует SDL для рисования некоторых сталкивающихся шаров на поверхности/окне в Mac OS X. Я уже могу выполнять столкновение и рисовать вещи последовательно. Я хотел бы иметь...
1359 просмотров
schedule 14.04.2022

Скажите NVCC, чтобы НЕ выполнялась предварительная обработка кода хоста, чтобы избежать переопределения BOOST_COMPILER.
У меня есть .cu-файл, содержащий код хоста и устройства: // device code __global__ void myKernel() { ... } // host code #include <boost/thread/mutex.hpp> boost::mutex myMutex; int main() { ... } Как видите, я включаю мьютекс-функции...
781 просмотров
schedule 20.06.2022

Установщик cuda toolkit 5.0 не создает nvcc bin
Я пытаюсь установить CUDA Toolkit 5.0 на Ubuntu 12.04. Я следил за всеми учебниками и нигде не могу найти свою проблему. Я делаю все, что нужно (выключаю lightdm, создаю символическую ссылку на libglut, экспортирую пути..., как в...
170 просмотров
schedule 28.08.2022

Связывание динамического параллелизма CUDA
У меня есть GTX TITAN, на котором я бы использовал динамический параллелизм. Я сделал несколько тестов, добавив «-rdc = true» и флаг «-lcudadevrt», но при компиляции всегда получаю ошибку компоновки. Это мой Makefile: DEP...
990 просмотров
schedule 31.08.2022

nvcc — разные размеры блоков в зависимости от архитектуры во время компиляции
У меня есть ядро, которое показывает максимальную производительность для различных размеров блоков при работе на оборудовании Kepler и Fermi. Я хотел бы во время компиляции проверить текущую цель архитектуры и определить макрос THREADS_PER_BLOCK...
242 просмотров
schedule 02.11.2023

Использование GHC с NVCC
В качестве альтернативы accelerate я пытаюсь вызвать код CUDA через FFI Haskell. Вот простая программа, которая не компилируется: cuda_code.cu: void cuda_init() { cudaFree (0); cudaThreadSynchronize (); } Тест.hs: foreign...
256 просмотров
schedule 08.08.2023

Смешайте компиляцию MPI и CUDA с динамическим параллелизмом
Я столкнулся с одной проблемой компиляции, когда хотел скомпилировать смешанную программу MPI + CUDA с поддержкой динамического параллелизма. Исходный код dyn_pal.cu #include <stdio.h> #include <cuda.h> #define N 100 #define M 32...
1847 просмотров
schedule 26.05.2023

Ошибка недопустимого символа устройства CUDA
приведенный ниже код компилируется просто отлично. Но когда я пытаюсь запустить его, я получаю GPUassert: invalid device symbol file.cu 114 Когда я комментирую строки, отмеченные (!!!), ошибка не появляется. Мой вопрос в том, что вызывает...
14638 просмотров
schedule 29.07.2023

Компилятор CUDA предупреждает о нераспознанной прагме GCC
В файле CUDA есть некоторый код C++, который использует эту прагму: #pragma GCC diagnostic push #pragma GCC diagnostic ignored "-Wunused-result" void foobar() { // some code } #pragma GCC diagnostic pop Когда этот файл...
1292 просмотров
schedule 01.09.2023

Компиляция части программы C++ для GPU
Можно ли скомпилировать (C++) код для графического процессора с nvcc в общий объект (файл .so) и динамически загрузить его из программы C++ (в данном случае — файла Cern ROOT , который по существу является интерпретатором C++ ("CINT")) ....
1563 просмотров
schedule 17.07.2023

Компиляция библиотеки с cuda 7.0 с использованием nvcc в Windows при привязке к 32-битному python 2.5
Я пытаюсь скомпилировать библиотеку, которую можно вызывать из python с помощью nvcc. Обычно в Windows я использую цепочку инструментов msys/mingw и могу без проблем компилировать расширения Python. Однако, когда я пытаюсь скомпилировать с помощью...
566 просмотров
schedule 26.01.2023

Ошибка компиляции с nvcc и С++ 11, нужен минимальный неудачный пример
Следующий код (первоначально из Boost) не компилируется с использованием nvcc 7.0 с включенной поддержкой C++11: #include <memory> template<typename T> struct result_of_always_void { typedef void type; }; template<typename F,...
503 просмотров
schedule 16.12.2022

CUDA nvcc строит цепочку библиотек
Моя цель: library2.so использует library1.so , а mycode.o использует (библиотеки должны быть связаны) library2.so (и, возможно, library1.so ). Исходный код (файлы заголовков одной строки опущены): библиотека1.cu: __device__ void...
2353 просмотров
schedule 02.09.2022

CUDA: забвение конфигурации запуска ядра не приводит к предупреждению или ошибке компилятора NVCC
Когда я пытаюсь вызвать ядро ​​CUDA (функция __global__ ) с помощью указателя функции, все работает нормально. Однако, если я забуду предоставить конфигурацию запуска при вызове ядра, NVCC не приведет к ошибке или предупреждению, но программа...
637 просмотров
schedule 03.10.2022

Как получить текущие вычислительные возможности графического процессора из основной части кода?
Я пытался использовать __CUDA_ARCH__ , но где-то читал, что это работает только с частью кода, относящейся к устройству. После этого я наткнулся на этот код на github: ссылка Есть ли лучший способ добиться этого? Я спрашиваю об этом, потому...
240 просмотров