字节顺序

不同的 CPU 有不同的字节序类型 这些字节序是指整数在内存中保存的顺序 这个叫做主机序 
最常见的有两种 
1 . Little endian :将低序字节存储在起始地址 
2 . Big endian :将高序字节存储在起始地址 

LE little-endian
最符合人的思维的字节序 
地址低位存储值的低位 
地址高位存储值的高位 
怎么讲是最符合人的思维的字节序,是因为从人的第一观感来说 
低位值小,就应该放在内存地址小的地方,也即内存地址低位 
反之,高位值就应该放在内存地址大的地方,也即内存地址高位 

BE big-endian
最直观的字节序 
地址低位存储值的高位 
地址高位存储值的低位 
为什么说直观,不要考虑对应关系 
只需要把内存地址从左到右按照由低到高的顺序写出 
把值按照通常的高位到低位的顺序写出 
两者对照,一个字节一个字节的填充进去 


图示如下:

大端字节(Big-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
       0x1000                  0x1001
_____________________________
|                           |
|         0x31             |       0x32
|________________ | ________________
高位字节在低位字节的前面,也就是高位在内存地址低的一端.可以这样记住(大端->高位->在前->正常的逻辑顺序)
 
小端字节(little-endian):
----------------->>>>>>>>内存地址增大方向
short变量地址
       0x1000                  0x1001
_____________________________
|                           |
|         0x32             |       0x31
|________________ | ________________
低位字节在高位字节的前面,也就是低位在内存地址低的一端.可以这样记住(小端->低位->在前->与正常逻辑顺序相反)
 

下面给出一个程序检测系统采用的是什么字节顺序。


#include <sys/utsname.h>
#include <unistd.h>
#include <stdio.h>

int main()
{
	union
	{
		short	inum;
		char c[sizeof(short)];
	} un;
	struct utsname	uts;
	un.inum=0x0102;
	if(uname(&uts)<0)
	{
		printf("Could not get host information .\n");
		return -1;
	}
	printf("%s -%s-%s:\n",uts.machine, uts.sysname, uts.release);
	if(sizeof(short)!=2)
	{
		printf("sizeof short =%d\n", sizeof(short));
		return 0;
	}
	if(un.c[0]==1 && un.c[1]==2)
		printf("big_endian.\n");
	else if(un.c[0]==2 && un.c[1]==1)
		printf("little_endian.\n");
	else
		printf("unknown .\n");
	return 0;
}



网络协议中的数据采用统一的网络字节顺序,因为只有采用统一的字节顺序,才能在不同的机器之间正确的发送和接收数据。Internet规定的网络字节顺序采用big-endian方式。

Linux采用了4个库函数来进行字节的转换:



Ø.unsigned long int htonl(unsignedlong int hostlong);


      主机字节顺序转换为网络字节顺序(对无符号长整型进行操作,4bytes)


Ø. unsigned short int htons(unsignedshort int hostshort);


      主机字节顺序转换为网络字节顺序(对无符号短整型进行操作,2bytes)


Ø .unsigned long int ntohl(unsignedlong int netlong);


      网络字节顺序转换为主机字节顺序


Ø .unsigned short int ntohs(unsignedshort int netshort);


      网络字节顺序转换为主机字节顺序

注:n代表net, h代表host, s代表short,l代表long

在编程中,需要使用网络字节顺序时,应该使用这几个函数来进行转换,绝对不要依赖于具体的机器表示的方式。


字节处理函数

套接字地址是多字节数据,不是以空字符结尾的,这和C语言中的字符串是不同的。Linux提供两组函数来处理多字节数据,一组函数以b(byte)开头,是和BSD系统兼容的函数;另一组函数以mem开头,是ANSIC提供的函数。

以b开头的函数如下:


bzero

原型:extern void bzero(void *s, int n);

用法:#include <string.h>

功能:将以地址s开头的的前n个字节为零。

说明:bzero无返回值。bzero只能在linux下调用


bcopy

原型:extern void bcopy(const void *src, void *dest, int n);

用法:#include <string.h>

功能:将字符串src的前n个字节复制到dest中

说 明:bcopy不检查字符串中的空字节NULL,函数没有返回值。目标和源的位置与memcpy和strcpy不 同。


bcmp

  原 型:extern int bcmp(const void *s1, const void *s2, int n);

  用 法:#include <string.h>

  功 能:比较字符 串s1和s2的前n个字节是否相等

说明:如果s1=s2或n=0则返回零,否则返回非零值。bcmp不检查NULL。



以m开头的函数如下:


memset

           memset直接对字节操作

           功 能:将s所指向的 某一块内存中的每个字节的内容全部设置为ch指 定的ASCII值。即将指定的内存,以   字节为单位,置为ch所 代表的内存形式。块的大小由第三个参数指定,这个函 数通常为新申请的内存做初始化工作。

          用 法: void *memset(void *s, char ch, unsigned n);

          原 理:以 字节为单位复制内存的二进制形式,到指定的内存区域。

(注:第二个数字也可以是int型, 然后截取该int变 量的最低字节。作为复制的二进制模板。所以第二个字节最常见的是0全 部置零 或 -1全部 置1。)

        用 途:memset最 常见的用途是对struct做初始化工作

memset(结 构体的地址,0,sizeof(结构体));



memcpy


           memcpy用来做内存拷贝,你可以拿它拷贝任何数据类型的对象,可以指定拷贝的数据长度。

           原型:extern void *memcpy(void *dest, void *src, unsigned int count);

           功能:由src所指内存区域复制count个字节到dest所指内存区域。

           说明:src和dest所指内存区域不能重叠,函数返回指向dest的指针


memcmp

             原型:extern int memcmp(void *buf1, void *buf2, unsigned int count);

             用法:#include <string.h>

             功能:比较内存区域buf1和buf2的前count个字节。

             说明:当buf1<buf2时,返回值<0

                   当buf1=buf2时,返回值=0

                   当buf1>buf2时,返回值>0