Проблема, которую я пытаюсь решить, заключается в следующем:
Последовательный код C++, который у меня есть, вычисляет большую двумерную матрицу. Чтобы оптимизировать этот процесс, я хочу разделить эту большую 2D-матрицу и запустить ее на 4 узлах (скажем) с использованием MPI. Единственная связь, которая происходит между узлами, — это совместное использование значений ребер в конце каждого временного шага. Каждый узел разделяет данные массива ребер A[i][j] со своим соседом.
Основываясь на прочитанном о MPI, у меня есть следующая схема, которую нужно реализовать.
if (myrank == 0)
{
for (i= 0 to x)
for (y= 0 to y)
{
C++ CODE IMPLEMENTATION
....
MPI_SEND(A[x][0], A[x][1], A[x][2], Destination= 1.....)
MPI_RECEIVE(B[0][0], B[0][1]......Sender = 1.....)
MPI_BARRIER
}
if (myrank == 1)
{
for (i = x+1 to xx)
for (y = 0 to y)
{
C++ CODE IMPLEMENTATION
....
MPI_SEND(B[x][0], B[x][1], B[x][2], Destination= 0.....)
MPI_RECEIVE(A[0][0], A[0][1]......Sender = 1.....)
MPI BARRIER
}
Я хотел знать, правильный ли мой подход, а также был бы признателен за любые рекомендации по другим функциям MPI, которые также необходимо изучить для реализации.
Спасибо, Ашвин.