Предполагается ли, что сопроцессоры, такие как Intel Xeon-Phi, используются так же, как и графические процессоры, поэтому необходимо разгрузить большое количество блоков, выполняющих одно ядро, чтобы только общая пропускная способность, которую обрабатывает сопроцессор, приводит к увеличению скорости, ИЛИ разгрузка независимых потоков (задач) также повысит эффективность?
Сопроцессорные ускорители по сравнению с графическими процессорами
Ответы (1)
Xeon Phi требует высокой степени как функционального параллелизма (разные потоки), так и векторного параллелизма (SIMD). Поскольку ядра по существу представляют собой улучшенные процессоры Pentium, последовательный код выполняется медленно. Это несколько изменится со следующим поколением, поскольку оно будет использовать более быстрые и современные ядра. Нынешний процессор Xeon Phi, как и любой другой сопроцессор, также страдает от узкого места ввода-вывода, поскольку ему приходится обмениваться данными через шину PCIe.
Таким образом, хотя вы можете разгрузить ядро на каждый процессор и использовать 512-битную векторизацию (аналогично GPGPU), вы также можете разделить свой код на множество различных функциональных блоков (т. е. разные коды/ядра) и запускать их на разных наборах процессоров Intel. Ядра Xeon Phi. Опять же, различные блоки кода также должны использовать 512-битные векторы SIMD.
Xeon Phi также работает как собственный процессор, поэтому вы можете получить доступ к другим ресурсам, монтируя деревья каталогов NFS, обмениваясь данными между платами и другими процессорами в кластере с помощью TCP/IP, используя MPI и т. д. Обратите внимание, что это не «разгрузка», а родное исполнение. Но шина PCIe по-прежнему остается серьезным узким местом, ограничивающим ввод-вывод.
Обобщить,
- Вы можете использовать модель разгрузки, аналогичную той, что используется GPGPU,
- Сам Xeon Phi также может поддерживать функциональный параллелизм (более одного ядра), но каждое ядро также должно использовать 512-битный SIMD.
- Вы также можете написать собственный код и использовать MPI, рассматривая Xeon Phi как обычный (без разгрузки) узел (всегда помня об узком месте ввода-вывода PCIe).