Вопросы по теме 'infiniband'
Взаимодействие MPI между Windows и Linux
У меня есть несколько окон Windows и Linux, соединенных с Infiniband, и мне нужно запускать задания MPI в обеих средах. Кто-нибудь знает, как лучше всего их взаимодействовать?
В настоящее время я рассматриваю возможность использования бета-версии...
1096 просмотров
schedule
29.03.2023
Совместное использование памяти RDMA
У меня есть несколько многоядерных компьютеров, соединенных сетью Infiniband. Я хотел бы иметь некоторые вычисления с малой задержкой в пуле общей памяти с удаленными атомарными операциями. Я знаю, что RDMA — это путь. На каждом узле я бы...
3870 просмотров
schedule
17.04.2022
MPI_Bcast зависает после передачи некоторых данных
Я запускаю приложение, которое выполняет некоторые преобразования больших матриц в кластере из 7 узлов. Узлы подключены через QDR 40 Gbit Infiniband. В системе установлен Open MPI 1.4.3.
Данное матричное преобразование требует большого обмена...
631 просмотров
schedule
17.07.2022
ошибка сегментации с использованием заданий openMPI с SLURM
У меня проблема при попытке использовать задания SBATCH slurm или задания SRUN с MPI через infiniband.
OpenMPI установлен, и если я запускаю следующую тестовую программу (называемую hello ) с mpirun -n 30 ./hello , она работает.
//...
6252 просмотров
schedule
22.03.2023
Как использовать SRQ с разными соединениями в libibverbs
Как использовать SRQ при подключении к более чем одному соединению. скажем, есть три соединения, а именно процесс 0, 1 и 2. для создания SRQ нам нужно вызвать
struct ibv_srq *ibv_create_srq(struct ibv_pd *pd, struct ibv_srq_init_attr...
995 просмотров
schedule
07.10.2022
Как получить информацию об ошибках из функций глаголов Infiniband?
В частности, я хотел бы знать, почему ibv_create_qp терпит неудачу. Когда он возвращает NULL, указывая на то, что произошел сбой, есть ли способ выяснить, в чем именно заключалась проблема?
117 просмотров
schedule
06.06.2023
Игрушечная программа не работает с OpenMPI 1.6, но работает с Mvapich2
Я пытаюсь понять, почему моя версия OpenMPI 1.6 не работает. Я использую gcc-4.7.2 на CentOS 6.6. Дана игрушечная программа (например, hello.c)
#include <stdio.h>
#include <stdlib.h>
#include <mpi.h>
int main(int argc, char *...
1691 просмотров
schedule
19.09.2022
Можно ли использовать библиотеки RDMA Mellanox из модуля ядра?
Я хочу разработать модуль ядра, который может отправлять/получать сообщения RDMA. Мне интересно, можно ли вызывать библиотеки Mellanox из пространства ядра.
Можно ли вызывать функции Mellanox RDMA из модуля ядра?
Ответ: у меня есть рабочий...
535 просмотров
schedule
30.01.2023
Передача RDMA без сопоставления памяти
У меня есть дополнительные процессы, которые должны обмениваться файлами по сети IB. Затем файлы будут использоваться другими процессами.
Рабочий процесс следующий:
Создавать файлы в /dev/shm
Измените размер файлов соответствующим образом...
383 просмотров
schedule
25.07.2022
Почему Intel MPI использует родные глаголы DAPL и OpenMPI?
Я не понимаю, почему Intel MPI использует DAPL, если собственные ibverbs быстрее, чем DAPL, OpenMPI использует собственные ibverbs. Однако в этом бенчмарке IntelMPI показал лучшую производительность....
2900 просмотров
schedule
26.04.2023
Что означает ядро драйвера в контексте драйверов устройств ядра Linux?
Я читал книгу Linux Device Drivers, Third Edition, а в разделе «Собираем все вместе» в главе 14 они упоминают взаимодействие между «ядром PCI, ядром драйвера и отдельными драйверами PCI». И они использовали слово «ядро драйвера» несколько раз....
650 просмотров
schedule
06.05.2024
Многосетевой искровой кластер
Я работаю над настройкой кластера Spark в многосетевой сети и столкнулся с некоторыми проблемами. Начну с физической конфигурации.
У меня есть 12 узлов в стойке с межстоечной сетью 100G infiniband с использованием ipoib и сетью управления 1G....
195 просмотров
schedule
16.05.2023
В чем разница между OFED, MLNX OFED и входящим драйвером
Я настраиваю сети Infiniband и не совсем понимаю разницу между разными программными стеками.
OFED https://www.openfabrics.org/ofed-for-linux/
MLNX OFED https://www.mellanox.com/page/products_dyn?product_family=27&mtag=linux_driver
Драйвер...
2350 просмотров
schedule
30.11.2022