关于simd:NEON指南5Coding-for-Neon

3次阅读

共计 412 个字符,预计需要花费 2 分钟才能阅读完成。

学习路线指南:https://zhuanlan.zhihu.com/p/…
原文地址:https://developer.arm.com/arc…

Coding for Neon

Load and store – example RGB conversion (HWC->CHW)

将 RGB 数据从 memory 程序拷入 registers 的会使通道的 swap 变得蠢笨。
思考以下指令,该指令一次从存储器将一个字节加载 RGB 数据到三个 Neon 寄存器的间断通道中
LD1 {V0.16B, V1.16B, V2.16B}, [x0]

Load and store – data structures

Load and store – leftovers

Permutation – rearranging vectors

Permutation – Neon instructions

Matrix multiplication

Shifting left and right

Related information

正文完
 0