将32位阵列复制到16位阵列的最快方法是什么?

将32位阵列复制到16位阵列的最快方法是什么?,第1张

概述将32位阵列复制到16位阵列的最佳方法是什么? 我知道“memcpy”使用硬件指令.但是有没有一个标准函数来复制每个元素中“更改大小”的数组? 我使用gcc作为armv7(皮质A8). uint32_t tab32[500];uint16_t tab16[500];for(int i=0;i<500;i++) tab16[i]=tab32[i]; 在带有Neon指令集的ARM cort 将32位阵列复制到16位阵列的最佳方法是什么?

我知道“memcpy”使用硬件指令.但是有没有一个标准函数来复制每个元素中“更改大小”的数组?

我使用gcc作为armv7(皮质A8).

uint32_t tab32[500];uint16_t tab16[500];for(int i=0;i<500;i++)    tab16[i]=tab32[i];
解决方法 在带有Neon指令集的ARM cortex A8上,最快的方法使用交错读/写指令:

vld2.16 {d0,d1},[r0]!vst1.16 {d0},[r1]!

或饱和指令将32位整数的向量转换为16位整数的向量.

这两种方法都可以在c中使用gcc intrinsic. gcc也可以自动向量化一个精心编写的c代码,只使用这些特定的指令.这基本上要求与这些指令和c代码的所有副作用一一对应.

总结

以上是内存溢出为你收集整理的将32位阵列复制到16位阵列的最快方法是什么?全部内容,希望文章能够帮你解决将32位阵列复制到16位阵列的最快方法是什么?所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: https://outofmemory.cn/langs/1215280.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-06-05
下一篇 2022-06-05

发表评论

登录后才能评论

评论列表(0条)

保存