Публикации по теме 'neon'


Сократите пропускную способность диска KDE Baloo с помощью Cgroups
Полезный метод в любое время, когда вы хотите ограничить использование ресурсов процессом. Мне нравится использовать KDE, и частью этой среды рабочего стола является программа под названием baloo. Я не использую его много, но это удобно, когда я делаю. Но программа может быть огромным пожирателем дисковых ресурсов. Наконец-то я нашел надежное исправление для этого, и оно не только поможет вам, если вы используете baloo, но и может помочь вам с некоторыми другими программами. Одна..

Оптимизация производительности вывода NN на Arm NEON и Vulkan
Эта статья представляет собой обзор презентации Axe Inc. на виртуальных технических переговорах разработчиков AI 21 сентября 2021 года. Обзор Этот доклад начинается с обзора ailia SDK , затем вводятся методы оптимизации для высокоскоростного вывода нейронных сетей в среде Arm. Основываясь на нашем исследовании по разработке ailia SDK, мы представляем оптимизацию для процессора Arm с использованием инструкций NEON SIMD и различных оптимальных реализаций вычислительных шейдеров для..

Вопросы по теме 'neon'

Есть ли хороший справочник по встроенным функциям ARM Neon?
В справочном руководстве ARM не содержится слишком подробного описания отдельных инструкций ( http://infocenter.arm.com/help/index.jsp?topic=/com.arm.doc.dui0348b/BABIIBBG.html ). Есть что-нибудь более подробное?
21722 просмотров
schedule 18.03.2023

Нет встроенных функций xor gcc для ARM NEON
Я не смог найти никаких встроенных функций для простой операции xor. См .: http://gcc.gnu.org/onlinedocs/gcc/ARM-NEON-Intrinsics.html Неужели нет возможности использовать для этого NEON инструкции?
1401 просмотров
schedule 20.04.2022

Ошибки компилятора при создании проекта, использующего Eigen, библиотеку шаблонов C ++ для линейной алгебры.
в моем проекте я использую библиотеку Eigen C ++ для линейной алгебры и ТОЛЬКО когда я включаю флаги векторизации (mfpu = neon -mfloat-abi = softfp) для ARM NEON, я получаю ошибки компилятора . Я не могу понять, что не так. Нужно ли мне включать...
1973 просмотров
schedule 08.03.2023

Загрузить 8-битный uint8_t как uint32_t?
мой проект обработки изображений работает с изображениями в градациях серого. У меня процессорная платформа ARM Cortex-A8. Я хочу использовать НЕОН. У меня есть изображение в градациях серого (рассмотрите пример ниже), и в моем алгоритме мне...
4228 просмотров
schedule 31.07.2022

Как изменить порядок векторных данных четверного слова с помощью Neon Intrinsics?
Вопрос связан с внутренностями ARM NEON. Я использую встроенные функции ARM neon для реализации FIR. Я хочу переупорядочить векторные данные в четырех словах. Например, в регистре Neon есть четыре 32-битных элемента, скажем, Q0, размер которых...
1039 просмотров
schedule 11.11.2023

Математические функции более высокого уровня в сборке ARM с NEON
Привет, я новичок в сборке и начинаю знакомиться со сборкой ARM в сочетании с сопроцессором NEON в некоторых новых чипах ARM. Одна из вещей, которую я не знаю, как это сделать, — это математические функции высокого уровня, такие как sin, cos, tan,...
1679 просмотров
schedule 26.04.2023

Проблемы с двухъядерным кодом Qualcomm Scorpion ARM NEON?
Я разрабатываю нативную библиотеку для Android, где использую оптимизации сборки ARM и многопоточность, чтобы получить максимальную производительность на двухъядерном чипсете ARM MSM8660. Делая некоторые замеры, я заметил следующее:...
1172 просмотров
schedule 09.03.2023

ARM Neon: VPADAL для вычитания
Я использую инструкцию VPADAL.U32 , чтобы значительно увеличить скорость моего кода добавления. Однако мне нужно было бы что-то вычитать с накоплением и нести (именно то, что я получил в качестве сложения). Желаемое или реально возможное? Из...
412 просмотров
schedule 03.06.2024

Скалярный продукт / w Neon Intrinsics
Я пытаюсь написать оптимизированный точечный продукт для процессора ARM A8, используя встроенные функции Neon, но у меня возникли небольшие проблемы. Прежде всего, есть ли какая-нибудь библиотека, которая уже это реализует? Мой код, кажется,...
4979 просмотров
schedule 03.10.2022

Настройки сборки Android NDK ARM для работы на большинстве устройств?
У меня есть несколько приложений Android NDK, и люди жалуются, что мое приложение не работает на их телефонах. Что я хотел бы знать, так это то, какие параметры компиляции будут поддерживать большинство, если не все устройства ARM на рынке? Моя...
4424 просмотров
schedule 03.02.2023

Совместимость типов данных с внутренними функциями NEON
Я работаю над оптимизацией ARM с использованием встроенных функций NEON из кода C ++. Я понимаю и справляюсь с большинством проблем с набором текста, но я застрял на этом: Инструкция vzip_u8 возвращает значение uint8x8x2_t (фактически массив...
2833 просмотров
schedule 13.05.2022

В любом случае использовать переменную в имени регистра в NEON?
Регистры расширения NEON можно рассматривать как 16 четверных слов или 32 двойных слова. В большинстве программ конкретный используемый регистр является фиксированным. Например, vmov.i8 d0, 0xff vmov.i8 d1, 0xee vmov.i8 d2, 0xdd В моей...
283 просмотров
schedule 07.11.2022

Объяснение выборки изображения ARM Neon
Я пытаюсь написать лучшую версию cv::resize() OpenCV, и я наткнулся на код, который находится здесь: https://github.com/rmaz/NEON-Image-Downscaling/blob/master/ImageResize/BDPViewController.m Код предназначен для понижения разрешения изображения на...
1680 просмотров
schedule 27.02.2023

Неоновые векторные инструкции сборки, влияющие на флаги
Я использую сборку руки и инструкции NEON SIMD. Я хочу получить максимум 16-битных значений без знака, которые находятся в двух регистрах Q, и сравнить их с порогом. Если все 16-битные значения меньше порогового значения, я вызываю функцию. Если...
259 просмотров
schedule 10.05.2022

Измените размер 8-битного изображения на 2 с помощью ARM NEON
У меня есть 8-битное изображение 640x480, которое я хотел бы уменьшить до изображения 320x240: void reducebytwo(uint8_t *dst, uint8_t *src) //src is 640x480, dst is 320x240 Как лучше всего это сделать с помощью ARM SIMD NEON? Где-нибудь есть...
2678 просмотров
schedule 23.07.2022

Ассемблер ARM Neon + C, как передать и использовать массив указателей
У меня есть функция C, и я хочу загрузить данные из массива указателей, переданных в часть ассемблера. Как это сделать? float *pointerToBuffer asm volatile ( "vld1.32 {q0},[%[buf]] \n\t" : [buf]"+r"(ponterToBuffer) ); Что, если бы...
259 просмотров
schedule 01.04.2023

Компиляция Opus 1.1-rc2 для iOS с помощью XCode 5
Я пытаюсь скомпилировать Opus 1.1-rc2 с оптимизацией ARM NEON для iOS. Вот конфигурация, которую я использую: export CC="xcrun -sdk iphoneos clang -arch armv7" export CCAS="xcrun -sdk iphoneos clang -arch armv7 -no-integrated-as" ./configure...
2363 просмотров
schedule 09.10.2022

Регистры SIMD в процессоре ARM
Рад, что вы прочитали мою ветку. Большое Вам спасибо. У меня вопрос про ARM NEON. Первый вопрос о размере реестра. Я хотел бы знать фактический размер регистров SIMD «Apple A6» и «Cortex A15». Второй вопрос касается цикла инструкции SIMD....
1164 просмотров
schedule 04.08.2023

Оптимизация сборки RGBA-›RGB arm64
Я написал эту очень наивную реализацию NEON для преобразования из RGBA в RGB. Это работает, но мне было интересно, есть ли что-нибудь еще, что я мог бы сделать для дальнейшего улучшения производительности. Я попытался поиграть с размером...
1348 просмотров
schedule 30.07.2022

ARM NEON: как реализовать поисковую таблицу размером 256 байт
Я портирую написанный мной код на NEON, используя встроенную сборку. Мне нужно преобразовать байтовые значения в диапазоне [0..128] в другие байтовые значения в таблице, которые принимают полный диапазон [0..255] Таблица короткая, но математика,...
3121 просмотров
schedule 21.10.2022