C/C++中的聯合體union及CPU大小端判定

來源:互聯網
上載者:User

 在C/C++程式的編寫中,當多個基礎資料型別 (Elementary Data Type)或複合資料結構要佔用同一片記憶體時,我們要使用聯合體;當多種類型,多個對象,多個事物只取其一時(我們姑且通俗地稱其為“n 選1”),我們也可以使用聯合體來發揮其長處。首先看一段代碼:

View Code

union myun 
{
  struct { int x; int y; int z; }u;
   int k;
}a;
int main()
{
   a.u.x =4;
  a.u.y =5;
   a.u.z =6;
   a.k = 0;
   printf("%d %d %d\n",a.u.x,a.u.y,a.u.z);
   return 0;
}
union類型是共用記憶體的,以size最大的結構作為自己的大小,這樣的話,myun這個結構就包含u這個結構體,而大小也等於u這個結構體的大小,在記憶體中的排列為聲明的順序x,y,z從低到高,然後賦值的時候,在記憶體中,就是x的位置放置4,y的位置放置5,z的位置放置6,現在對k賦值,對k的賦值因為是union,要共用記憶體,所以從union的首地址開始放置,首地址開始的位置其實是x的位置,這樣原來記憶體中x的位置就被k所賦的值代替了,就變為0了,這個時候要進行列印,就直接看記憶體裡就行了,x的位置也就是k的位置是0,而y,z的位置的值沒有改變,所以應該是 0,5,6。 再看兩個試題:試題一:編寫一段程式判斷系統中的CPU 是Little endian 還是Big endian 模式?
分析:
作為一個電腦相關專業的人,我們應該在電腦群組成中都學習過什麼叫Little endian 和Big endian。Little endian 和Big endian 是CPU 存放資料的兩種不同順序。對於整型、長整型等資料類型,Big endian 認為第一個位元組是最高位位元組( 按照從低地址到高地址的順序存放資料的高位位元組到低位位元組——大端);而Little endian 則相反,它認為第一個位元組是最低位位元組( 按照從低地址到高地址的順序存放資料的低位位元組到高位位元組——小端)。
例如,假設從記憶體位址0x0000 開始有以下資料:
0x12 0x34 0xab 0xcd
如果我們去讀取一個地址為0x0000 的四個位元組變數,若位元組序為big-endian,則讀出結果為0x1234abcd;若位元組序位little-endian,則讀出結果為xcdab3412。如果我們將0x1234abcd 寫入到以0x0000 開始的記憶體中,則Little endian 和Big endian 模式的存放結果如下:
地址               0x0000 0x0001 0x0002 0x0003
big-endian        0x12     0x34     0xab     0xcd
little-endian       0xcd     0xab     0x34     0x12
一般來說,x86 系列CPU 都是little-endian 的位元組序,PowerPC 通常是Big endian,還有的CPU 能通過跳線來設定CPU 工作於Little endian 還是Big endian 模式。
解答:
顯然,解答這個問題的方法只能是將一個位元組(CHAR/BYTE 類型)的資料和一個整型資料存放於同樣的記憶體開始地址,通過讀取整型資料,分析CHAR/BYTE 資料在整型資料的高位還是低位來判斷CPU 工作於Little endian 還是Big endian 模式。得出如下的答案:View Code

typedef unsigned char BYTE;
int main(int argc, char* argv[])
{
  unsigned int num,*p;
  p = #
  num = 0;
  *(BYTE *)p = 0xff;
  if(num == 0xff)
  {
    printf("The endian of cpu is little\n");
  }
  else //num == 0xff000000
  {
    printf("The endian of cpu is big\n");
  }
  return 0;
}

除了上述方法(通過指標類型強制轉換並對整型資料首位元組賦值,判斷該賦值賦給了高位還是低位)外,還有沒有更好的辦法呢?我們知道,union 的成員本身就被存放在相同的記憶體空間(共用記憶體,正是union 發揮作用、做貢獻的去處),因此,我們可以將一個CHAR/BYTE 資料和一個整型資料同時作為一個union 的成員,得出
如下答案:View Code

int checkCPU()
{
  union w
  {
   int a;
   char b;
  }c;
  c.a = 1;
  return (c.b == 1); // 小端返回TRUE,大端返回FALSE
}
實現同樣的功能,我們來看看Linux 作業系統中相關的原始碼是怎麼做的:View Code

static union { char c[4]; unsigned long mylong; } endian_test = {{ 'l', '?', '?', 'b' } };
#define ENDIANNESS ((char)endian_test.mylong)

Linux 的核心作者們僅僅用一個union 變數和一個簡單的宏定義就實現了一大段代碼同樣的功能!由以上一段代碼我們可以深刻領會到Linux 原始碼的精妙之處!(如果ENDIANNESS=’l’表示系統為little endian,為’b’表示big endian )
試題二:假設網路節點A 和網路節點B 中的通訊協定涉及四類報文,報文格式為“報文類型欄位+報文內容的結構體”,四個報文內容的結構體類型分別為STRUCTTYPE1~ STRUCTTYPE4,請編寫程式以最簡單的方式組
織一個統一的報文資料結構。
分析:
報文的格式為“報文類型+報文內容的結構體”,在真實的通訊中,每次只能發四類報文中的一種,我們可以將四類報文的結構體組織為一個union(共用一段記憶體,但每次有效只是一種),然後和報文類型欄位統一組織成一個報文資料結構。
解答:
根據上述分析,我們很自然地得出如下答案:View Code

typedef unsigned char BYTE;
//報文內容聯合體
typedef union tagPacketContent
{
  STRUCTTYPE1 pkt1;
  STRUCTTYPE2 pkt2;
  STRUCTTYPE3 pkt1;
  STRUCTTYPE4 pkt2;
}PacketContent;
//統一的報文資料結構
typedef struct tagPacket
{
  BYTE pktType;
  PacketContent pktContent;
}Packet;

【參考資料 感謝作者】

以上摘自:http://blog.chinaunix.net/u2/84450/showart_1829958.html

另外,我看到篇文章:http://hi.baidu.com/ilotus_y/blog/item/e8d68c29130875f998250aaa.html 討論C++聯合體的進階應用程式。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.