linux gcc下结构体对齐模数的问题

linux gcc下结构体对齐模数的问题,第1张

16的话,大概是因为lz的gcc默认是64位的编译吧,如果是64位的话,可以看一下int的字节数,应该是8吧,那当然是以8为模了

我的是32位的,所以对齐模数默认是4,12没有问题

SIMD的全称是Single Instruction Multiple Data (单指令多数据流)。

在支持SIMD的CPU中,包含着一些特别宽的寄存器(比如512位)。通过特别的指令,可以在这些寄存器上执行指定 *** 作。这些 *** 作通常是对正常寄存器(比如64位)上 *** 作的拓展,可以理解为一条指令同时 *** 作了多个正常寄存器,也就是所谓的SIMD了。

做个简单的除法就能知道,512位的寄存器相比64位寄存器,速度提升了8倍。

但是实际情况不仅仅是如此。在SIMD的指令中,还包括了一些非常奇妙的指令,比如计算正态分布的累积分布函数和其反函数的指令。在看到它们的时候,我心里吼了一句:“还有这种 *** 作!”。这些特化的指令在特别的场景下就是神器。

首先,我们是在Linux的GCC编译器上使用SIMD指令。在这个条件下,有两个途径:

嵌入式汇编不是今天的主题。我今天主要记录一下Intrinsics怎么用。不管使用哪种方法,有一个网站是一定要收藏的: Intel Intrinsics Guide

它给出了SIMD指令集的各个子集: MMX, SSE,SSE4.2,AVX2等等。同时,它给每个指令都打上一些标签用于检索:Load,Store,Cast,Arithmetic 等等。它还给出了每个指令的等价 *** 作和汇编指令。

具体地说,在C语言中使用SIMD涉及三个方面:

头文件和函数调用很好办,它归属于Intel的规范。在Intel Intrinsics Guide中,每条指令需要的头文件都有标注,按图索骥即可。

编译选项则属于GCC的规范。 i386 and x86-64 Options 将相关选项包含在内,但是更宽一些。每条指令都有所属的指令集(比如SSE4.2),当使用到该指令后,就要在链接器的选项中加上相关的项 (比如 -msse4.2 ) 。

选项的命名很直接,在 i386 and x86-64 Options 里搜索 -mmmx 就可以跳到SIDM选项比较集中的区域,很容易就能确定需要的选项是什么。

使用SIMD指令的范式很简单:

这里涉及到一个问题,就是导入导出使用到的内存必须满足特殊的对齐条件。比如使用了128位(16字节)的SIMD,则内存首地址必须能被16整除。如果不满足该条件,在导入数据时程序会引发段错误退出。

在C中,获得特定对齐方式的动态内存,使用的函数是来自 stdlib.h 的 void* aligned_alloc(size_t alignment, size_t size) 。

编译的指令如下:


欢迎分享,转载请注明来源:内存溢出

原文地址: http://outofmemory.cn/yw/7219379.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
上一篇 2023-04-03
下一篇 2023-04-03

发表评论

登录后才能评论

评论列表(0条)

保存