Вопросы по теме 'memory-bandwidth'
Сколько данных можно загрузить за цикл из GDDR5?
nVidia GTX980 имеет пропускную способность 224 ГБ/с и тактовую частоту памяти 7 Гбит/с. Его ширина шины составляет 256 бит.
Можем ли мы рассчитать, сколько макс/мин данных можно загрузить параллельно с GDDR5?
Могу ли я получить ответ, разделив...
46 просмотров
schedule
02.12.2022
Загрузка/сохранение за цикл для последних поколений архитектуры ЦП
Вдохновленный этим ответом на
FLOPS за цикл для sandy-bridge и haswell SSE2 /AVX/AVX2
каково количество просто-загрузок/загрузок-и-хранилищ, которые можно было бы выдать на ядре - для Sandy/Ivy Bridge, Broad/Haswell, Sky/Kaby Lake? Также...
567 просмотров
schedule
13.11.2022
Что конкретно помечает строку кэша x86 как грязную - любая запись или требуется явное изменение?
Этот вопрос специально нацелен на современные согласованные архитектуры с кешем x86-64 - я понимаю, что на других процессорах ответ может быть другим.
Если я пишу в память, протокол MESI требует, чтобы строка кеша сначала считывалась в кеш, а...
1099 просмотров
schedule
08.04.2022
Как рассчитать пропускную способность памяти в данной (Linux) системе из оболочки?
Я хочу написать сценарий/команду оболочки, которая использует общедоступные двоичные файлы, файловую систему /sys или другие средства для расчета теоретической максимальной пропускной способности для оперативной памяти, доступной на данной машине....
2677 просмотров
schedule
25.08.2022
Пропускная способность/объединение памяти OpenCL
Резюме:
Я пытаюсь написать программу OpenCL с привязкой к памяти, которая приближается к объявленной пропускной способности памяти на моем графическом процессоре. На самом деле я ошибаюсь примерно в 50 раз.
Настраивать:
У меня есть только...
122 просмотров
schedule
11.05.2022
Добавление массива SIMD против развертывания
Я создал простой тест, который использовал SIMD для добавления 4 элементов массива за раз (для суммирования), а не просто накапливал его с 4-мя суммирующими переменными и складывал их в конце. Вот мой тестовый код:
#include <stdio.h>...
142 просмотров
schedule
14.04.2022