Регистры SIMD в процессоре ARM

Рад, что вы прочитали мою ветку. Большое Вам спасибо.

У меня вопрос про ARM NEON.

Первый вопрос о размере реестра.

Я хотел бы знать фактический размер регистров SIMD «Apple A6» и «Cortex A15».

Второй вопрос касается цикла инструкции SIMD.

Я предполагаю, что у многих регистров NEON процессора ARM есть 64-битные.

Согласно руководству, «Как двойное изображение, ширина 128 бит»

Означает ли это, что даже если я использую 4 x 32-битное значение в 2 из 64-битных регистров NEON,

Будет обрабатываться за один цикл?

Я хотел бы знать разные циклы между 128-битным NEON и 64-битным NEON.

Спасибо!


person Henrik    schedule 18.12.2013    source источник
comment
Все это должно быть подробно описано в руководствах по процессору, не так ли? Я имею в виду, что руководство по ЦП для.   -  person cHao    schedule 18.12.2013
comment
cHao // Вы нашли руководство для Apple A6?   -  person Henrik    schedule 18.12.2013
comment
Неа. Я этого не искал. Это твоя работа. :)   -  person cHao    schedule 18.12.2013
comment
Сначала я спросил здесь, потому что не смог найти ничего, что касалось Apple A6.   -  person Henrik    schedule 18.12.2013
comment
Во-вторых, следующий вопрос касается цикла. Мне нужен ответ какого-то эксперта, у которого есть конкретные знания о цикле обработки по инструкции NEONSIMD.   -  person Henrik    schedule 18.12.2013
comment
Следовательно, если бы я мог найти только в простом гугле, я бы не стал спрашивать здесь, поэтому я спрашиваю людей здесь. Спасибо за беспокойство, кстати, @cHao: P   -  person Henrik    schedule 18.12.2013
comment
Если для A6 нет руководства, то Apple не хочет, чтобы люди знали о его внутренностях. Если это так, то единственные люди здесь, которые будут иметь доступ к ресурсам, отличным от Интернета и руководств по ARM ... почти наверняка находятся под соглашением о неразглашении, которое они не собираются рисковать взломать сайт, которого они даже не получают. платят за ответы на вопросы по. : P Что есть в сети, то и есть.   -  person cHao    schedule 18.12.2013
comment
Спасибо, мне может понадобиться подождать кого-нибудь, кто знает или интересуется той же темой. :)   -  person Henrik    schedule 18.12.2013


Ответы (1)


Это зависит от выполняемой инструкции.

Как правило, простые инструкции ALU требуют не больше циклов, связанных с регистрами Q, чем регистры D, но инструкции умножения и / или перестановки требуют вдвое больше циклов при работе с регистрами Q. Вы также должны знать, что очень часто результаты в нижних 64-битных Qd доступны раньше, чем результаты в верхней половине.

Я не думаю, что Apple A6 ведет себя как-то иначе, чем «оригинальный» CA-15, когда дело касается циклов. А поскольку все они используют один и тот же ISA, вы можете быть уверены, что регистры одинаковы в архитектуре ARMv7.

person Jake 'Alquimista' LEE    schedule 24.12.2013
comment
Спасибо за ваш ответ! - person Henrik; 29.12.2013