linux gcc下结构体对齐模数的问题_系统运维

16的话，大概是因为lz的gcc默认是64位的编译吧，如果是64位的话，可以看一下int的字节数，应该是8吧，那当然是以8为模了

我的是32位的，所以对齐模数默认是4，12没有问题

SIMD的全称是Single Instruction Multiple Data (单指令多数据流)。

在支持SIMD的CPU中，包含着一些特别宽的寄存器（比如512位）。通过特别的指令，可以在这些寄存器上执行指定 *** 作。这些 *** 作通常是对正常寄存器（比如64位）上 *** 作的拓展，可以理解为一条指令同时 *** 作了多个正常寄存器，也就是所谓的SIMD了。

做个简单的除法就能知道，512位的寄存器相比64位寄存器，速度提升了8倍。

但是实际情况不仅仅是如此。在SIMD的指令中，还包括了一些非常奇妙的指令，比如计算正态分布的累积分布函数和其反函数的指令。在看到它们的时候，我心里吼了一句：“还有这种 *** 作！”。这些特化的指令在特别的场景下就是神器。

首先，我们是在Linux的GCC编译器上使用SIMD指令。在这个条件下，有两个途径：

嵌入式汇编不是今天的主题。我今天主要记录一下Intrinsics怎么用。不管使用哪种方法，有一个网站是一定要收藏的： Intel Intrinsics Guide

它给出了SIMD指令集的各个子集: MMX， SSE，SSE4.2，AVX2等等。同时，它给每个指令都打上一些标签用于检索：Load，Store，Cast，Arithmetic 等等。它还给出了每个指令的等价 *** 作和汇编指令。

具体地说，在C语言中使用SIMD涉及三个方面：

头文件和函数调用很好办，它归属于Intel的规范。在Intel Intrinsics Guide中，每条指令需要的头文件都有标注，按图索骥即可。

编译选项则属于GCC的规范。 i386 and x86-64 Options 将相关选项包含在内，但是更宽一些。每条指令都有所属的指令集（比如SSE4.2），当使用到该指令后，就要在链接器的选项中加上相关的项 (比如 -msse4.2 ) 。

选项的命名很直接，在 i386 and x86-64 Options 里搜索 -mmmx 就可以跳到SIDM选项比较集中的区域，很容易就能确定需要的选项是什么。

使用SIMD指令的范式很简单：

这里涉及到一个问题，就是导入导出使用到的内存必须满足特殊的对齐条件。比如使用了128位（16字节）的SIMD，则内存首地址必须能被16整除。如果不满足该条件，在导入数据时程序会引发段错误退出。

在C中，获得特定对齐方式的动态内存，使用的函数是来自 stdlib.h 的 void* aligned_alloc(size_t alignment, size_t size) 。

编译的指令如下：

欢迎分享，转载请注明来源：内存溢出

linux gcc下结构体对齐模数的问题