Я изучаю параллелизм OpenMP и пробовал свои силы в имеющемся у меня коде. В этом коде я попытался сделать все циклы for параллельными. Однако это, кажется, делает программу НАМНОГО медленнее, по крайней мере, в 10 раз медленнее или даже больше, чем однопоточная версия.
Вот код: http://pastebin.com/zyLzuWU2
Я также использовал pthreads, которые оказались быстрее, чем однопоточная версия.
Теперь вопрос в том, что я делаю неправильно в своей реализации OpenMP, что вызывает это замедление?
Спасибо!
редактировать: однопоточная версия - это просто версия без всех #pragmas