Публикации по теме 'parallel-computing'


Н-БФТ
Новый простой, быстрый и распараллеливаемый алгоритм обхода в ширину (BFT) для больших разреженных графов с несколькими входами и несколькими выходами. Эту реализацию можно использовать для любого типа графов, но здесь мы реализовали это для графов схемы EDA. Согласно закону Мура, с удвоением количества транзисторов в электронных схемах каждые два года сложность цифровых электронных схем также увеличивается день ото дня. Это одна из самых больших проблем, с которыми сталкивается..

Переосмысление параллелизма в Go, простота заходит далеко.
Go, разработанный Google, задумывался как язык, использующий преимущества современных компьютеров (и кластеров компьютеров) для более быстрого выполнения параллельного и асинхронного кода с простой семантикой. Однако многие из первоначальных идей и шаблонов были усовершенствованы, упрощены и улучшены. В разделах Основы параллельных вычислений в Go и Дополнительная информация о каналах Go, параллелизме и параллелизме» мы рассмотрели некоторые основные понятия параллелизма и..

Раскрытие возможностей биоинспирированного параллелизма с помощью мембранных вычислений
Быстрое и практическое введение в мембранные вычисления с помощью Open MPI Возможно, большинство из вас уже слышали о квантовых вычислениях, кубитах, запутанности и других вещах, которые выглядят «круто» только потому, что в их названиях есть слово «квант». Чего вы не знаете, так это того, что на данный момент все эти «квантовые» вещи неосуществимы на практике. Да, у нас есть настоящие квантовые компьютеры, такие как IBM-Q или Google Sycamore , но они могут решать только..

Стоит ли использовать графический процессор для проекта машинного обучения?
МАШИННОЕ ОБУЧЕНИЕ Стоит ли использовать графический процессор для проекта машинного обучения? Узнайте об основных различиях между использованием ЦП и ГП в вашем проекте машинного обучения и поймите, что выбрать. Многие проекты машинного обучения включают обучение алгоритму на огромных объемах данных и, следовательно, требуют больших вычислительных мощностей. Эта вычислительная мощность обычно связана с количеством и качеством обрабатывающих устройств, таких как центральный процессор..

CUDA - Унифицированная архитектура вычислительных устройств - Часть 2
В этой статье давайте сосредоточимся на параметрах запуска устройства, их граничных значениях и неявных переменных, которые среда выполнения CUDA инициализирует во время выполнения. Эта статья является продолжением этой статьи . Итак, каковы параметры запуска устройства? Графический процессор следует архитектуре с одной инструкцией и несколькими потоками (SIMT) - это означает, что для обработки одной инструкции используется несколько потоков. Эти потоки организованы в блоки, а..

Изучите историю и эволюцию Tensorflow, вернувшись к Tensorflow 1.0, часть 1
Tensorflow 2.0 находится в стадии бета-тестирования с прошлого года, и это совершенно другая вселенная, чем его предшественник Tensorflow 1.0, но даже в 2020 году важно понимать историю и эволюцию библиотеки TF, чтобы понять, как она появилась отсюда и почему. выберите Keras как высокоуровневый API. Важно понимать, что такое вычислительный граф, поскольку это очень полезная концепция в глубоком обучении, и вы все равно можете визуализировать и исследовать ее в TensorBoard. Давайте..

Ускорение вашего кода (4): своевременная компиляция с Numba
Из этой серии: Пример кластеризации среднего сдвига в пространстве Пуанкаре Векторизация циклов с помощью Numpy Пакеты и многопоточность Своевременная компиляция с помощью Numba (этот пост) В предыдущих постах мы работали с нашим разумом, чтобы ускорить (относительно) простой алгоритм. Возможно, есть и другие умные способы выжать больше времени на выполнение, но мне в голову не пришло ничего очень интересного. Итак, пора переходить к грубой силе. Но все же я не буду..