Как объяснить эту цифру о `nvidia-smi` с графическими процессорами NVIDIA?

Я только что запустил simpleMultiGPU на сервере с двумя установленными K20m графическими процессорами. А затем запустите команду nvidia-smi, чтобы показать состояние графических процессоров. Результат выглядит следующим образом:

введите здесь описание изображения

Проблемы заключаются в следующем:

  1. Использование памяти GPU, кажется, не то же самое.
  2. Volatile GPU-Util device 1 составляет 99%.

Любой совет?


person mining    schedule 07.09.2014    source источник
comment
Что выводит simpleMultiGPU на консоль? Может быть очень большая вероятность, что он просто не порождает достаточно работы для обоих графических процессоров.   -  person Jonas Bötel    schedule 07.09.2014
comment
Привет спасибо! Консольный вывод simpleMultiGPU блокируется на generating input data ..., и я жду минут пять с небольшим, он тоже останавливается на этом, и в это время я также использую nvidia-smi для проверки статуса, от этого вроде бы ничего не изменилось. Я использую Ctrl+C, чтобы остановить процесс.   -  person mining    schedule 08.09.2014


Ответы (1)


  1. Не существует концепции, согласно которой использование памяти должно быть одинаковым при запуске приложений более чем на одном графическом процессоре. Кроме того, использование памяти может варьироваться в разных точках приложения в зависимости от базовой активности (например, точки, в которой выполняются выделения), когда происходит выборка использования памяти.

  2. Нестабильное использование графического процессора устройства 1, вероятно, указывает на то, что приложение и/или nvidia-smi вызывают активность на устройстве 1.

Непонятно, почему вы называете это проблемами. Вы отслеживаете активность на устройстве.

person Robert Crovella    schedule 07.09.2014