android–ARM Neon Assembler– 奇怪的管道问题

android–ARM Neon Assembler– 奇怪的管道问题,第1张

概述我试图使用Neon指令提高ARMAssembler中编写的代码的性能.为了测试和计算我使用这个计算器:http://pulsar.webshaker.net/ccc/sample-706454b3我注意到在“n.34-01cn0”线突然,霓虹灯装置似乎必须等待(?)10个周期.可能是什么原因或者只是计算器中的错误?另外,我需要一些一般信息

我试图使用Neon指令提高ARM Assembler中编写的代码的性能.

为了测试和计算我使用这个计算器:
http://pulsar.webshaker.net/ccc/sample-706454b3

我注意到在“n.34-0 1c n0”线突然,霓虹灯装置似乎必须等待(?)10个周期.可能是什么原因或者只是计算器中的错误?

另外,我需要一些一般信息来了解如何提高ARM / Neon汇编程序的性能.

Target是ARM Cortex-A9.
为了编译,我使用最新的androID-ndk和内联汇编程序.谢谢.

解决方法:

实际上这有点复杂.
BitBank是对的,NEON必须等待D4.

但是你必须等待10个周期,因为Neon有一个加载/存储队列.
并且在之前队列中充满了其他指令

vld1.64 d4, [r7, :64]@H_301_25@

所以当你需要D4时,你必须等待执行这条指令
但要执行此指令,必须执行推入NEON加载/存储队列的所有先前加载/存储指令.

总结

以上是内存溢出为你收集整理的android – ARM Neon Assembler – 奇怪的管道问题全部内容,希望文章能够帮你解决android – ARM Neon Assembler – 奇怪的管道问题所遇到的程序开发问题。

如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。

欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/web/1112852.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2022-05-29
下一篇 2022-05-29

发表评论

登录后才能评论

评论列表(0条)