У меня есть 4 графических процессора, подвешенных к одному коммутатору PCIe (PLX PEX 8747) в системе на основе Haswell. Я хочу отправить одни и те же данные на каждый графический процессор. Возможно ли, чтобы коммутатор PCIe реплицировал данные на N целей, а не выполнял N отдельных передач? Действительно ли можно передавать данные на N графических процессоров по шине PCIe?
Мне было интересно, как SLI/Crossfire справились с такими проблемами? Я могу представить, что большие объемы данных идентичны для каждого графического процессора в данной отображаемой сцене. Помнится, я где-то читал, что старая система NVIDIA 890 Ultra SLI включала этот широковещательный механизм в переключатель для SLI.
http://www.nvidia.com/docs/IO/52280/NVIDIA_Broadcast_PWShort_TB.pdf
Возможно ли это с более новыми коммутаторами PCIe?
Обновление: похоже, что стандарт PCIe поддерживает многоадресную рассылку, как указано в ответе ниже. Я нашел некоторую информацию об этом на
www.pcisig.com/developers/main/training_materials/get_document?doc_id=31337695e3bc0310ea570c9df49e507b9d3eb4a5
Да, я специально хотел использовать интерфейс CUDA или OpenCL для передачи данных на N устройств. Жаль, что API еще не поддерживает это.