共计 412 个字符,预计需要花费 2 分钟才能阅读完成。
学习路线指南:https://zhuanlan.zhihu.com/p/…
原文地址:https://developer.arm.com/arc…
Coding for Neon
Load and store – example RGB conversion (HWC->CHW)
将 RGB 数据从 memory 程序拷入 registers 的会使通道的 swap 变得蠢笨。
思考以下指令,该指令一次从存储器将一个字节加载 RGB 数据到三个 Neon 寄存器的间断通道中 LD1 {V0.16B, V1.16B, V2.16B}, [x0]
Load and store – data structures
Load and store – leftovers
Permutation – rearranging vectors
Permutation – Neon instructions
Matrix multiplication
Shifting left and right
Related information
正文完