我知道“memcpy”使用硬件指令.但是有没有一个标准函数来复制每个元素中“更改大小”的数组?
我使用gcc作为armv7(皮质A8).
uint32_t tab32[500];uint16_t tab16[500];for(int i=0;i<500;i++) tab16[i]=tab32[i];解决方法 在带有Neon指令集的ARM cortex A8上,最快的方法使用交错读/写指令:
vld2.16 {d0,d1},[r0]!vst1.16 {d0},[r1]!
或饱和指令将32位整数的向量转换为16位整数的向量.
这两种方法都可以在c中使用gcc intrinsic. gcc也可以自动向量化一个精心编写的c代码,只使用这些特定的指令.这基本上要求与这些指令和c代码的所有副作用一一对应.
总结以上是内存溢出为你收集整理的将32位阵列复制到16位阵列的最快方法是什么?全部内容,希望文章能够帮你解决将32位阵列复制到16位阵列的最快方法是什么?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)