目前我正在使用以下功能(@Troyseph,发现here):
uint parity64(uint64 n){ n ^= n >> 1; n ^= n >> 2; n = (n & 0x1111111111111111) * 0x1111111111111111; return (n >> 60) & 1;}
相同的SO页面具有以下汇编例程(由@papadp提供):
.code; bool CheckParity(size_t Result) CheckParity PROC mov rax,0 add rcx,0 jnp jmp_over mov rax,1jmp_over: retCheckParity ENDPEND
它利用了机器的parity flag.但我无法使用我的C程序(我知道旁边没有组装).
题.如何在C源文件中包含上面(或类似)代码作为内联汇编,以便使用parity64()函数来运行它?
(我在Intel Xeon Haswell上使用GCC和64位Ubuntu 14)
如果有任何帮助,可在以下例程中调用parity64()函数:
uint bindot(uint64* a,uint64* b,uint64 entrIEs){ uint parity = 0; for(uint i=0; i<entrIEs; ++i) parity ^= parity64(a[i] & b[i]); // Running sum! return parity;}
(这应该是场Z / 2Z上的两个向量的“点积”,即GF(2).)
解决方法 您将不得不使用扩展内联汇编(这是一个gcc扩展)来获得类似的效果.您的parity64功能可以更改如下 –
uint parity64(uint64 n){ uint result = 0; __asm__("addqn = (n >> 32) ^ n;n = (n >> 16) ^ n;n = (n >> 8) ^ n;,%0" : : "r"(n) :); __asm__("jnp 1f"); __asm__("movl ,%0" : "=r"(result) : : ); __asm__("1:"); return result;}
但正如@MichaelPetch评论的那样,奇偶校验标志仅在低8位上计算.因此,如果您的n小于255,这将适用于您.对于更大的数字,您将必须使用您在问题中提到的代码.
要使其工作在64位,您可以通过执行将32位整数的奇偶校验折叠为单字节
uint parity64(uint64 n){ unsigned char result = 0; n = (n >> 32) ^ n; n = (n >> 16) ^ n; n = (n >> 8) ^ n; __asm__("test %1,%1 \n\t" "setp %0" : "+r"(result) : "r"(n) : ); return result;}
此代码必须位于程序集之前的函数的开头.
您将不得不检查它对性能的影响.
我能得到的最优化的是
总结以上是内存溢出为你收集整理的在C中使用内联汇编进行位奇偶校验?全部内容,希望文章能够帮你解决在C中使用内联汇编进行位奇偶校验?所遇到的程序开发问题。
如果觉得内存溢出网站内容还不错,欢迎将内存溢出网站推荐给程序员好友。
欢迎分享,转载请注明来源:内存溢出
评论列表(0条)