不同的CPU有不同的位元組序類型 這些位元組序是指整數在記憶體中儲存的順序 這個叫做主機序
最常見的有兩種
1. Little endian(小頭):將低序位元組儲存在起始地址
2. Big endian(大頭):將高序位元組儲存在起始地址
LE little-endian
最符合人的思維的位元組序
地址低位儲存值的低位
地址高位儲存值的高位
怎麼講是最符合人的思維的位元組序,是因為從人的第一觀感來說
低位值小,就應該放在記憶體位址小的地方,也即記憶體位址低位
反之,高位值就應該放在記憶體位址大的地方,也即記憶體位址高位
BE big-endian
最直觀的位元組序
地址低位儲存值的高位
地址高位儲存值的低位
為什麼說直觀,不要考慮對應關係
只需要把記憶體位址從左至右按照由低到高的順序寫出
把值按照通常的高位到低位的順序寫出
兩者對照,一個位元組一個位元組的填充進去
例子:在記憶體中雙字0x01020304(DWORD)的儲存方式
記憶體位址
4000 4001 4002 4003
LE 04 03 02 01
BE 01 02 03 04
例子:如果我們將0x1234abcd寫入到以0x0000開始的記憶體中,則結果為
big-endian little-endian
0x0000 0x12 0xcd
0x0001 0x23 0xab
0x0002 0xab 0x34
0x0003 0xcd 0x12
x86系列CPU都是little-endian的位元組序.
網路位元組順序是TCP/IP中規定好的一種資料表示格式,它與具體的CPU類型、作業系統等無關,從而可以保證資料在不同主機之間傳輸時能夠被正確解釋。網路位元組順序採用big endian排序方式。
為了進行轉換 bsd socket提供了轉換的函數 有下面四個
htons 把unsigned short類型從主機序轉換到網路序
htonl 把unsigned long類型從主機序轉換到網路序
ntohs 把unsigned short類型從網路序轉換到主機序
ntohl 把unsigned long類型從網路序轉換到主機序
在使用little endian的系統中 這些函數會把位元組序進行轉換
在使用big endian類型的系統中 這些函數會定義成空宏
同樣 在網路程式開發時 或是跨平台開發時 也應該注意保證只用一種位元組序 不然兩方的解釋不一樣就會產生bug.
註:
1、網路與主機位元組轉換函式:htons ntohs htonl ntohl (s 就是short l是long h是host n是network)
2、不同的CPU上運行不同的作業系統,位元組序也是不同的,參見下表。
處理器 作業系統 位元組排序
Alpha 全部 Little endian
HP-PA NT Little endian
HP-PA UNIX Big endian
Intelx86 全部 Little endian <-----x86系統是小端位元組序系統
Motorola680x() 全部 Big endian
MIPS NT Little endian
MIPS UNIX Big endian
PowerPC NT Little endian
PowerPC 非NT Big endian <-----PPC系統是大端位元組序系統
RS/6000 UNIX Big endian
SPARC UNIX Big endian
IXP1200 ARM核心 全部 Little endian
一般來說,x86 系列CPU 都是little-endian 的位元組序,PowerPC 通常是Big endian,還有的CPU 能通過跳線來設定CPU 工作於Little endian 還是Big endian 模式。
解答:
顯然,解答這個問題的方法只能是將一個位元組(CHAR/BYTE 類型)的資料和一個整型資料存放於同樣的記憶體
開始地址,通過讀取整型資料,分析CHAR/BYTE 資料在整型資料的高位還是低位來判斷CPU 工作於Little
endian 還是Big endian 模式。得出如下的答案:
typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
unsigned int num,*p;
p = #
num = 0;
*(BYTE *)p = 0xff;
if(num == 0xff)
{
printf("The endian of cpu is little\n");
}
else //num == 0xff000000
{
printf("The endian of cpu is big\n");
}
return 0;
}
實現同樣的功能,我們來看看Linux 作業系統中相關的原始碼是怎麼做的:
static union { char c[4]; unsigned long mylong; } endian_test = {{ 'l', '?', '?', 'b' } };
#define ENDIANNESS ((char)endian_test.mylong)
Linux 的核心作者們僅僅用一個union 變數和一個簡單的宏定義就實現了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領會到Linux 原始碼的精妙之處!(如果ENDIANNESS=’l’表示系統為little endian,為’b’表示big endian )