不同机器内部对变量的
字节存储
顺序不同,有的采用
大端模式(big-endian),有的采用小端模式(little-endian)。大端模式是指高字节数据存放在低地址处,低字节数据放在高地址处。小端模式是指低字节数据存放在低地址处,高字节数据放在高地址处。在网络上传输数据时,由于数据传输的两端可能对应不同的硬件平台,采用的存储字节顺序也可能不一致,因此 TCP/IP 协议规定了在网络上必须采用网络字节顺序(也就是大端模式) 。通过对大小端的存储原理分析可发现,对于 char 型数据,由于其只占一个字节,所以不存在这个问题,这也是一般情况下把数据缓冲区定义成 char 类型 的原因之一。对于 IP 地址、端口号等非 char 型数据,必须在数据发送到网络上之前将其转换成大端模式,在接收到数据之后再将其转换成符合接收端主机的存储模式。Linux 系统为大小端模式的转换提供了 4 个函数,输入 man byteorder 命令可得函数原型:
<EM><STRONG><SPAN>#include <arpa/inet.h>uint32_t htonl()(uint32_t hostlong)uint16_t htons(uint16_t hostshort)uint32_t ntohl(uint32_t netlong)uint16_t ntohs(uint16_t netshort)</SPAN></STRONG></EM>htonl 表示 host to network long ,用于将主机 unsigned int 型数据转换成网络字节顺序;htons 表示 host to network short ,用于将主机 unsigned short 型数据转换成网络字节顺序;ntohl、ntohs 的功能分别与 htonl、htons 相反。通常使用的有两种数据类型:短型(两个字节)和长型(四个字节)。下面介绍的这些转换函数对于这两类的无符号整型变量都可以正确的转换。如果你想将一个短型数据从主机字节顺序转换到网络字节顺序的话,有这样一个函数htnos:它是以"h”开头的,代表“主机”;紧跟着它的是"to",代表“转换到”;然后是"n",代表“网络”;最后是"s",代表“短型数据”。你可以使用"n", "h", "to", "s", "l"的任意组合。当然,你要在可能的情况下进行组合。比如,系统是没有stolh()函数的(Short to Long Host ?)。下面给出套接字字节转换程序的列表:hotns()——"Host to NetWork Short",主机字节顺序转换为网络字节顺序(对无符号短型进行 *** 作 4bytes)htonl()——"Host to NetWork Long",主机字节顺序转换为网络字节顺序(对无符号长型进行 *** 作 8bytes)ntons()——"NetWork to Host short",网络字节序转换为主机字节顺序(对无符号短型进行 *** 作 4bytes)ntohl()——"NetWork to Host Long",网络字节顺序转换为主机字节顺序(对无符号长型进行 *** 作 8bytes)例如:*.sin_addr.s_addr = htonl(innaddr_any)是什么意思?*.sin_addr.s_addr = htonl(innaddr_any)是Socket编程中用到的。*是任意定义的一个sockaddr_in型的结构体对象sin_addr是他的一个属性,用于定义IP地址,是strcut in_addr型的,s_addr为结构体in_addr的对象,简单说就是三个结构体嵌套包装的一个包。inaddr_any一般为内核指定的,大多数系统取0,表示任意的IP地址。htonl()简单说是把一个本机IP转化为网络协议中规定的格式的函数,也就是所谓的大端模式或小端模式。
htons函数是将一个u_short类型的值从主机字节顺序转换为TCP/IP的网络字节顺序,原型声明如下:u_short htons(u_short hostshort)htonl函数是将一个u_long的值从主机字节顺序转换为TCP/IP的网络字节顺序,原型声明如下:u_long htonl(u_long hostlong)字节序和网络平台有关,不同的平台,字节序不同。(字节序顾名思义——字节的排列顺序)只有多于一个字节的数据类型,才有字节序的问题,比如short或者int类型。char是没有这个问题的。字节序就是在硬件里面,一般实在内存里,如何表示存储和表示这些数据类型。如果高字节放到高地址上,就是大端(big endian),如果高字节放到低地址上,就是小端模式(little endian)。实现同样的功能,我们来看看Linux *** 作系统中相关的源代码是怎么做的:
static union { char c[4]unsigned long mylong} endian_test = {{ 'l', '?', '?', 'b' } }
#define ENDIANNESS ((char)endian_test.mylong)
Linux 的内核作者们仅仅用一个union 变量和一个简单的宏定义就实现了一大段代码同样的功能!由以上一段代码我们可以深刻领会到Linux 源代码的精妙之处!(如果ENDIANNESS=’l’表示系统为little endian,
为’b’表示big endian )
http://blog.chinaunix.net/uid-25367385-id-188322.html
例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。对于大端模式,就将0x11放在低地址中,即0x0010中;0x22放在高地址中,即0x0011中。小端模式,刚好相反
一个判断当前系统是大端还是小端的函数,小端则返回1:
以上函数,若在小端系统下,其字节序为,b[0]中存储00000001,后三个字节依次存储00000000,大端系统下反之
在iOS开发中,苹果已经为我们定义好了一套用于大小端转换的宏定义:
NTOHL,network to host,L、S、LL分别对应long、short、long long
HTONL,反之
大小端转换原理如下:
假设一个short类型的数字:0x1122,那么其二进制形式为:00010001 00100010
首先,取出第一个字节,右移八位:
然后,取出第二个字节,左移八位:
最后,按位或,至此,大小端转换完成:
评论列表(0条)