作者:strongerHuang
通信协议中的数据传输、数组的存储方式、数据的强制转换等这些都会牵涉到大小端问题。
CPU的大端和小端模式很多地方都会用到,但还是有许多朋友不知道,今天暂且普及一下。
一、为什么会有大小端模式之分呢?
因为在计算机系统中,我们是以字节为单位的,每个地址单元都对应着一个字节,一个字节为8bit。
但是在C语言中除了8bit的char之外,还有16bit的short型,32bit的int型。另外,对于位数大于8位的处理器,例如16位或者32位的处理器,由于寄存器宽度大于一个字节,那么必然存在着一个如果将多个字节安排的问题。因此就导致了大端存储模式和小端存储模式。
例如一个16bit的short型x,在内存中的地址为0x0010,x的值为0x1122,那么0x11为高字节,0x22为低字节。
对于大端模式,就将0x11放在低地址中,即0x0010中,0x22放在高地址中,即0x0011中。小端模式,刚好相反。
二、什么是大端和小端?大端模式:是指数据的高字节保存在内存的低地址中,而数据的低字节保存在内存的高地址中。
小端模式:是指数据的高字节保存在内存的高地址中,而数据的低字节保存在内存的低地址中。
假如32位宽(uint32_t)的数据0x12345678,从地址0x08004000开始存放:
地址 | 小端存放内容 | 大端存放内容 |
0x08004003 | 0x12 | 0x78 |
0x08004002 | 0x34 | 0x56 |
0x08004001 | 0x56 | 0x34 |
0x08004000 | 0x78 | 0x12 |
再结合一张图进行理解:
从上面表格、图可以看得出来,大小端的差异在于存放顺序不同。
在维基百科中还有有一段关于“端的起源”:
三、数组在大端小端情况下的存储
以unsigned int value = 0x12345678为例,分别看看在两种字节序下其存储情况,我们可以用unsigned char buf[4]来表示value。
1.大端模式下
地址 | 数组 | 值 | 位置 |
高地址 | buf[3] | 0x78 | 低位 |
- | buf[2] | 0x56 | - |
- | buf[1] | 0x34 | - |
低地址 | buf[0] | 0x12 | 高位 |
2.小端模式下
地址 | 数组 | 值 | 位置 |
高地址 | buf[3] | 0x12 | 低位 |
- | buf[2] | 0x34 | - |
- | buf[1] | 0x56 | - |
低地址 | buf[0] | 0x78 | 高位 |
不知道大家对数组进行强制转换成整型数据没有?
如果你要进行强制转换,肯定要考虑大小端问题。
四、大小端谁更好?
小端模式:强制转换数据不需要调整字节内容,1、2、4字节的存储方式一样。
大端模式:符号位的判定固定为第一个字节,容易判断正负。
总结:大端小端没有谁优谁劣,各自优势便是对方劣势。
五、常见字节序
常见的操作系统是小端,通讯协议是大端。
1.常见CPU的字节序
大端模式:PowerPC、IBM、Sun
小端模式:x86、DEC
ARM既可以工作在大端模式,也可以工作在小端模式。
(内容来自网络)
2.STM32属于小端模式
测试一款MCU属于大端,还是小端方法很多种,通过打印数据,通过在线调试查看数据:
当然,在MCU的手册中也有相关说明。
六、大小端转换
开篇说了,实际应用中,大小端应用的地方很多通信协议、数据存储等。如果字节序不一致,就需要转换。
只要你理解其中原理(高低顺序),转换的方法很多,下面简单列列两个。
1.对于16位字数据
#define BigtoLittle16(A) (( ((uint16)(A) & 0xff00) >> 8) | \
(( (uint16)(A) & 0x00ff) << 8))
2.对于32位字数据
#define BigtoLittle32(A) ((( (uint32)(A) & 0xff000000) >> 24) | \
(( (uint32)(A) & 0x00ff0000) >> 8) | \
(( (uint32)(A) & 0x0000ff00) << 8) | \
(( (uint32)(A) & 0x000000ff) << 24))
方法很多种,感兴趣的朋友可自行研究。本文就写到这里,希望对你有帮助。
‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧ END ‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧‧
最后,黄工整理的干货比较多,推荐关注黄工的微信公众号『strongerHuang』,识别下面二维码关注。