Я хочу распараллелить последовательный код C в кластере с распределенной памятью из 100 узлов. Кластер состоит из 25 лезвий с 4 ядрами в каждом по infiniband. Раньше я просто использовал PBS для распространения нескольких последовательных запусков программы между разными узлами. Теперь мне интересно:
- Какова наилучшая альтернатива в этом случае OpenMP, MPI или OpenMPI (на данный момент я не хочу пробовать смешанный подход, поскольку начинаю учиться)?
- Где я могу найти примеры/учебники?
- Всегда ли OpenMP/MPI/OpemMPI для простого последовательного кода с основным циклом for работает лучше, чем подход с очередями, такой как PBS?