Мне было интересно, есть ли стандартный способ программно определить максимальное количество одновременных рабочих групп, которые могут работать на графическом процессоре.
Например, на карте NVIDIA с 5 вычислительными блоками (или SM) может быть максимум 8 рабочих групп (или блоков) на каждый вычислительный блок, поэтому максимальное количество рабочих групп, которые могут выполняться одновременно, равно 40.
Поскольку я могу найти количество вычислительных единиц с помощью clGetDeviceInfo
, все, что мне нужно, — это максимальное количество рабочих групп, которые можно запустить на вычислительной единице.
Спасибо!