Вопросы по теме 'infiniband'

Взаимодействие MPI между Windows и Linux
У меня есть несколько окон Windows и Linux, соединенных с Infiniband, и мне нужно запускать задания MPI в обеих средах. Кто-нибудь знает, как лучше всего их взаимодействовать? В настоящее время я рассматриваю возможность использования бета-версии...
1096 просмотров
schedule 29.03.2023

Совместное использование памяти RDMA
У меня есть несколько многоядерных компьютеров, соединенных сетью Infiniband. Я хотел бы иметь некоторые вычисления с малой задержкой в ​​​​пуле общей памяти с удаленными атомарными операциями. Я знаю, что RDMA — это путь. На каждом узле я бы...
3870 просмотров
schedule 17.04.2022

MPI_Bcast зависает после передачи некоторых данных
Я запускаю приложение, которое выполняет некоторые преобразования больших матриц в кластере из 7 узлов. Узлы подключены через QDR 40 Gbit Infiniband. В системе установлен Open MPI 1.4.3. Данное матричное преобразование требует большого обмена...
631 просмотров
schedule 17.07.2022

ошибка сегментации с использованием заданий openMPI с SLURM
У меня проблема при попытке использовать задания SBATCH slurm или задания SRUN с MPI через infiniband. OpenMPI установлен, и если я запускаю следующую тестовую программу (называемую hello ) с mpirun -n 30 ./hello , она работает. //...
6252 просмотров

Как использовать SRQ с разными соединениями в libibverbs
Как использовать SRQ при подключении к более чем одному соединению. скажем, есть три соединения, а именно процесс 0, 1 и 2. для создания SRQ нам нужно вызвать struct ibv_srq *ibv_create_srq(struct ibv_pd *pd, struct ibv_srq_init_attr...
995 просмотров
schedule 07.10.2022

Как получить информацию об ошибках из функций глаголов Infiniband?
В частности, я хотел бы знать, почему ibv_create_qp терпит неудачу. Когда он возвращает NULL, указывая на то, что произошел сбой, есть ли способ выяснить, в чем именно заключалась проблема?
117 просмотров
schedule 06.06.2023

Игрушечная программа не работает с OpenMPI 1.6, но работает с Mvapich2
Я пытаюсь понять, почему моя версия OpenMPI 1.6 не работает. Я использую gcc-4.7.2 на CentOS 6.6. Дана игрушечная программа (например, hello.c) #include <stdio.h> #include <stdlib.h> #include <mpi.h> int main(int argc, char *...
1691 просмотров
schedule 19.09.2022

Можно ли использовать библиотеки RDMA Mellanox из модуля ядра?
Я хочу разработать модуль ядра, который может отправлять/получать сообщения RDMA. Мне интересно, можно ли вызывать библиотеки Mellanox из пространства ядра. Можно ли вызывать функции Mellanox RDMA из модуля ядра? Ответ: у меня есть рабочий...
535 просмотров
schedule 30.01.2023

Передача RDMA без сопоставления памяти
У меня есть дополнительные процессы, которые должны обмениваться файлами по сети IB. Затем файлы будут использоваться другими процессами. Рабочий процесс следующий: Создавать файлы в /dev/shm Измените размер файлов соответствующим образом...
383 просмотров
schedule 25.07.2022

Почему Intel MPI использует родные глаголы DAPL и OpenMPI?
Я не понимаю, почему Intel MPI использует DAPL, если собственные ibverbs быстрее, чем DAPL, OpenMPI использует собственные ibverbs. Однако в этом бенчмарке IntelMPI показал лучшую производительность....
2900 просмотров
schedule 26.04.2023

Что означает ядро ​​драйвера в контексте драйверов устройств ядра Linux?
Я читал книгу Linux Device Drivers, Third Edition, а в разделе «Собираем все вместе» в главе 14 они упоминают взаимодействие между «ядром PCI, ядром драйвера и отдельными драйверами PCI». И они использовали слово «ядро драйвера» несколько раз....
650 просмотров
schedule 06.05.2024

Многосетевой искровой кластер
Я работаю над настройкой кластера Spark в многосетевой сети и столкнулся с некоторыми проблемами. Начну с физической конфигурации. У меня есть 12 узлов в стойке с межстоечной сетью 100G infiniband с использованием ipoib и сетью управления 1G....
195 просмотров

В чем разница между OFED, MLNX OFED и входящим драйвером
Я настраиваю сети Infiniband и не совсем понимаю разницу между разными программными стеками. OFED https://www.openfabrics.org/ofed-for-linux/ MLNX OFED https://www.mellanox.com/page/products_dyn?product_family=27&mtag=linux_driver Драйвер...
2350 просмотров
schedule 30.11.2022