C++記憶體管理詳解

來源:互聯網
上載者:User

偉大的Bill Gates 曾經失言:

  640K ought to be enough for everybody — Bill Gates 1981

  程式員們經常編寫記憶體管理程式,往往提心弔膽。如果不想觸雷,唯一的解決辦法就是發現所有潛伏的地雷並且排除它們,躲是躲不了的。本文的內容比一般教科書的要深入得多,讀者需細心閱讀,做到真正地通曉記憶體管理。

  1、記憶體配置方式

  記憶體配置方式有三種:

  (1)從靜態儲存地區分配。記憶體在程式編譯的時候就已經分配好,這塊記憶體在程式的整個運行期間都存在。例如全域變數,static變數。

  (2)在棧上建立。在執行函數時,函數內局部變數的儲存單元都可以在棧上建立,函數執行結束時這些儲存單元自動被釋放。棧記憶體配置運算內建於處理器的指令集中,效率很高,但是分配的記憶體容量有限。

  (3) 從堆上分配,亦稱動態記憶體分配。程式在啟動並執行時候用malloc或new申請任意多少的記憶體,程式員自己負責在何時用free或delete釋放記憶體。動態記憶體的生存期由我們決定,使用非常靈活,但問題也最多。

  2、常見的記憶體錯誤及其對策

  發生記憶體錯誤是件非常麻煩的事情。編譯器不能自動探索這些錯誤,通常是在程式運行時才能捕捉到。而這些錯誤大多沒有明顯的癥狀,時隱時現,增加了改錯的難度。有時使用者怒氣沖沖地把你找來,程式卻沒有發生任何問題,你一走,錯誤又發作了。 常見的記憶體錯誤及其對策如下:

  * 記憶體配置未成功,卻使用了它。

  編程新手常犯這種錯誤,因為他們沒有意識到記憶體配置會不成功。常用解決辦法是,在使用記憶體之前檢查指標是否為NULL。如果指標p是函數的參數,那麼在函數的入口處用assert(p!=NULL)進行

  檢查。如果是用malloc或new來申請記憶體,應該用if(p==NULL) 或if(p!=NULL)進行防錯處理。

  * 記憶體配置雖然成功,但是尚未初始化就引用它。

  犯這種錯誤主要有兩個起因:一是沒有初始化的觀念;二是誤以為記憶體的預設初值全為零,導致引用初值錯誤(例如數組)。 記憶體的預設初值究竟是什麼並沒有統一的標準,儘管有些時候為零值,我們寧可信其無不可信其有。所以無論用何種方式建立數組,都別忘了賦初值,即便是賦零值也不可省略,不要嫌麻煩。

  * 記憶體配置成功並且已經初始化,但操作越過了記憶體的邊界。

  例如在使用數組時經常發生下標“多1”或者“少1”的操作。特別是在for迴圈語句中,迴圈次數很容易搞錯,導致數組操作越界。

  * 忘記了釋放記憶體,造成記憶體泄露。

  含有這種錯誤的函數每被調用一次就丟失一塊記憶體。剛開始時系統的記憶體充足,你看不到錯誤。終有一次程式突然死掉,系統出現提示:記憶體耗盡。

  動態記憶體的申請與釋放必須配對,程式中malloc與free的使用次數一定要相同,否則肯定有錯誤(new/delete同理)。

  * 釋放了記憶體卻繼續使用它。
 
  有三種情況:

  (1)程式中的對象調用關係過於複雜,實在難以搞清楚某個對象究竟是否已經釋放了記憶體,此時應該重新設計資料結構,從根本上解決對象管理的混亂局面。

  (2)函數的return語句寫錯了,注意不要返回指向“棧記憶體”的“指標”或者“引用”,因為該記憶體在函數體結束時被自動銷毀。

  (3)使用free或delete釋放了記憶體後,沒有將指標設定為NULL。導致產生“野指標”。

  【規則1】用malloc或new申請記憶體之後,應該立即檢查指標值是否為NULL。防止使用指標值為NULL的記憶體。

  【規則2】不要忘記為數組和動態記憶體賦初值。防止將未被初始化的記憶體作為右值使用。

  【規則3】避免數組或指標的下標越界,特別要當心發生“多1”或者“少1”操作。

  【規則4】動態記憶體的申請與釋放必須配對,防止記憶體流失。

  【規則5】用free或delete釋放了記憶體之後,立即將指標設定為NULL,防止產生“野指標”。

  3、指標與數組的對比

  C++/C程式中,指標和數組在不少地方可以相互替換著用,讓人產生一種錯覺,以為兩者是等價的。

  數組要麼在靜態儲存區被建立(如全域數組),要麼在棧上被建立。數組名對應著(而不是指向)一塊記憶體,其地址與容量在生命期內保持不變,只有數組的內容可以改變。

  指標可以隨時指向任意類型的記憶體塊,它的特徵是“可變”,所以我們常用指標來操作動態記憶體。指標遠比數組靈活,但也更危險。

  下面以字串為例比較指標與數組的特性。

  3.1 修改內容

  樣本3-1中,字元數組a的容量是6個字元,其內容為hello。a的內容可以改變,如a[0]= ‘X’。指標p指向常量字串“world”(位於靜態儲存區,內容為world),常量字串的內容是不可以被修改的。從文法上看,編譯器並不覺得語句p[0]= ‘X’有什麼不妥,但是該語句企圖修改常量字串的內容而導致運行錯誤。

char a[] = “hello”;
a[0] = ‘X’;
cout << a << endl;
char *p = “world”; // 注意p指向常量字串
p[0] = ‘X’; // 編譯器不能發現該錯誤
cout << p << endl;

      樣本3.1 修改數組和指標的內容

  3.2 內容複寫與比較

  不能對數組名進行直接複製與比較。樣本7-3-2中,若想把數組a的內容複寫給數組b,不能用語句 b = a ,否則將產生編譯錯誤。應該用標準庫函數strcpy進行複製。同理,比較b和a的內容是否相同,不能用if(b==a) 來判斷,應該用標準庫函數strcmp進行比較。

  語句p = a 並不能把a的內容複寫指標p,而是把a的地址賦給了p。要想複製a的內容,可以先用庫函數malloc為p申請一塊容量為strlen(a)+1個字元的記憶體,再用strcpy進行字串複製。同理,語句if(p==a) 比較的不是內容而是地址,應該用庫函數strcmp來比較。

// 數組…
char a[] = "hello";
char b[10];
strcpy(b, a); // 不能用 b = a;
if(strcmp(b, a) == 0) // 不能用 if (b == a)

// 指標…
int len = strlen(a);
char *p = (char *)malloc(sizeof(char)*(len+1));
strcpy(p,a); // 不要用 p = a;
if(strcmp(p, a) == 0) // 不要用 if (p == a)

       樣本3.2 數組和指標的內容複寫與比較

  3.3 計算記憶體容量

  用運算子sizeof可以計算出數組的容量(位元組數)。樣本7-3-3(a)中,sizeof(a)的值是12(注意別忘了’’)。指標p指向a,但是sizeof(p)的值卻是4。這是因為sizeof(p)得到的是一個指標變數的位元組數,相當於sizeof(char*),而不是p所指的記憶體容量。C++/C語言沒有辦法知道指標所指的記憶體容量,除非在申請記憶體時記住它。

  注意當數組作為函數的參數進行傳遞時,該數組自動退化為同類型的指標。樣本7-3-3(b)中,不論數組a的容量是多少,sizeof(a)始終等於sizeof(char *)。

char a[] = "hello world";
char *p = a;
cout<< sizeof(a) << endl; // 12位元組
cout<< sizeof(p) << endl; // 4位元組

     樣本3.3(a) 計算數組和指標的記憶體容量

void Func(char a[100])
{
 cout<< sizeof(a) << endl; // 4位元組而不是100位元組
}

     樣本3.3(b) 數組退化為指標

  4、指標參數是如何傳遞記憶體的?

  如果函數的參數是一個指標,不要指望用該指標去申請動態記憶體。樣本7-4-1中,Test函數的語句GetMemory(str, 200)並沒有使str獲得期望的記憶體,str依舊是NULL,為什嗎?

void GetMemory(char *p, int num)
{
 p = (char *)malloc(sizeof(char) * num);
}
void Test(void)
{
 char *str = NULL;
 GetMemory(str, 100); // str 仍然為 NULL
 strcpy(str, "hello"); // 運行錯誤
}

      樣本4.1 試圖用指標參數申請動態記憶體

  毛病出在函數GetMemory中。編譯器總是要為函數的每個參數製作臨時副本,指標參數p的副本是 _p,編譯器使 _p = p。如果函數體內的程式修改了_p的內容,就導致參數p的內容作相應的修改。這就是指標可以用作輸出參數的原因。在本例中,_p申請了新的記憶體,只是把_p所指的記憶體位址改變了,但是p絲毫未變。所以函數GetMemory並不能輸出任何東西。事實上,每執行一次GetMemory就會泄露一塊記憶體,因為沒有用free釋放記憶體。

  如果非得要用指標參數去申請記憶體,那麼應該改用“指向指標的指標”,見樣本4.2。

void GetMemory2(char **p, int num)
{
 *p = (char *)malloc(sizeof(char) * num);
}
void Test2(void)
{
 char *str = NULL;
 GetMemory2(&str, 100); // 注意參數是 &str,而不是str
 strcpy(str, "hello");
 cout<< str << endl;
 free(str);
}

      樣本4.2用指向指標的指標申請動態記憶體

  由於“指向指標的指標”這個概念不容易理解,我們可以用函數傳回值來傳遞動態記憶體。這種方法更加簡單,見樣本4.3。

char *GetMemory3(int num)
{
 char *p = (char *)malloc(sizeof(char) * num);
 return p;
}
void Test3(void)
{
 char *str = NULL;
 str = GetMemory3(100);
 strcpy(str, "hello");
 cout<< str << endl;
 free(str);
}

       樣本4.3 用函數傳回值來傳遞動態記憶體

  用函數傳回值來傳遞動態記憶體這種方法雖然好用,但是常常有人把return語句用錯了。這裡強調不要用return語句返回指向“棧記憶體”的指標,因為該記憶體在函數結束時自動消亡,見樣本4.4。

char *GetString(void)
{
 char p[] = "hello world";
 return p; // 編譯器將提出警告
}
void Test4(void)
{
 char *str = NULL;
 str = GetString(); // str 的內容是垃圾
 cout<< str << endl;
}

      樣本4.4 return語句返回指向“棧記憶體”的指標

  用調試器逐步跟蹤Test4,發現執行str = GetString語句後str不再是NULL指標,但是str的內容不是“hello world”而是垃圾。
如果把樣本4.4改寫成樣本4.5,會怎麼樣?

char *GetString2(void)
{
 char *p = "hello world";
 return p;
}
void Test5(void)
{
 char *str = NULL;
 str = GetString2();
 cout<< str << endl;
}

     樣本4.5 return語句返回常量字串

  函數Test5運行雖然不會出錯,但是函數GetString2的設計概念卻是錯誤的。因為GetString2內的“hello world”是常量字串,位於靜態儲存區,它在程式生命期內恒定不變。無論什麼時候調用GetString2,它返回的始終是同一個“唯讀”的記憶體塊。

  5、杜絕“野指標”

  “野指標”不是NULL指標,是指向“垃圾”記憶體的指標。人們一般不會錯用NULL指標,因為用if語句很容易判斷。但是“野指標”是很危險的,if語句對它不起作用。 “野指標”的成因主要有兩種:

  (1)指標變數沒有被初始化。任何指標變數剛被建立時不會自動成為NULL指標,它的預設值是隨機的,它會亂指一氣。所以,指標變數在建立的同時應當被初始化,要麼將指標設定為NULL,要麼讓它指向合法的記憶體。例如

char *p = NULL;
char *str = (char *) malloc(100);

  (2)指標p被free或者delete之後,沒有置為NULL,讓人誤以為p是個合法的指標。

  (3)指標操作超越了變數的作用範圍。這種情況讓人防不勝防,樣本程式如下:

class A
{
 public:
  void Func(void){ cout << “Func of class A” << endl; }
};
void Test(void)
{
 A *p;
 {
  A a;
  p = &a; // 注意 a 的生命期
 }
 p->Func(); // p是“野指標”
}

  函數Test在執行語句p->Func()時,對象a已經消失,而p是指向a的,所以p就成了“野指標”。但奇怪的是我運行這個程式時居然沒有出錯,這可能與編譯器有關。

  6、有了malloc/free為什麼還要new/delete?

  malloc與free是C++/C語言的標準庫函數,new/delete是C++的運算子。它們都可用於申請動態記憶體和釋放記憶體。

  對於非內部資料類型的對象而言,光用maloc/free無法滿足動態對象的要求。對象在建立的同時要自動執行建構函式,對象在消亡之前要自動執行解構函式。由於malloc/free是庫函數而不是運算子,不在編譯器控制許可權之內,不能夠把執行建構函式和解構函式的任務強加於malloc/free。

   因此C++語言需要一個能完成動態記憶體分配和初始化工作的運算子new,以及一個能完成清理與釋放記憶體工作的運算子delete。注意new/delete不是庫函數。我們先看一看malloc/free和new/delete如何?對象的動態記憶體管理,見樣本6。

class Obj
{
 public :
  Obj(void){ cout << “Initialization” << endl; }
  ~Obj(void){ cout << “Destroy” << endl; }
  void Initialize(void){ cout << “Initialization” << endl; }
  void Destroy(void){ cout << “Destroy” << endl; }
};
void UseMallocFree(void)
{
 Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態記憶體
 a->Initialize(); // 初始化
 //…
 a->Destroy(); // 清除工作
 free(a); // 釋放記憶體
}
void UseNewDelete(void)
{
 Obj *a = new Obj; // 申請動態記憶體並且初始化
 //…
 delete a; // 清除並且釋放記憶體
}

     樣本6 用malloc/free和new/delete如何?對象的動態記憶體管理

  類Obj的函數Initialize類比了建構函式的功能,函數Destroy類比了解構函式的功能。函數UseMallocFree中,由於malloc/free不能執行建構函式與解構函式,必須調用成員函數Initialize和Destroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。

  所以我們不要企圖用malloc/free來完成動態對象的記憶體管理,應該用new/delete。由於內部資料類型的“對象”沒有構造與析構的過程,對它們而言malloc/free和new/delete是等價的。

  既然new/delete的功能完全覆蓋了malloc/free,為什麼C++不把malloc/free淘汰出局呢?這是因為C++程式經常要調用C函數,而C程式只能用malloc/free管理動態記憶體。

  如果用free釋放“new建立的動態對象”,那麼該對象因無法執行解構函式而可能導致程式出錯。如果用delete釋放“malloc申請的動態記憶體”,理論上講程式不會出錯,但是該程式的可讀性很差。所以new/delete必須配對使用,malloc/free也一樣。

  7、記憶體耗盡怎麼辦?

  如果在申請動態記憶體時找不到足夠大的記憶體塊,malloc和new將返回NULL指標,宣告記憶體申請失敗。通常有三種方式處理“記憶體耗盡”問題。

  (1)判斷指標是否為NULL,如果是則馬上用return語句終止本函數。例如:

void Func(void)
{
 A *a = new A;
 if(a == NULL)
 {
  return;
 }
 …
}

  (2)判斷指標是否為NULL,如果是則馬上用exit(1)終止整個程式的運行。例如:

void Func(void)
{
 A *a = new A;
 if(a == NULL)
 {
  cout << “Memory Exhausted” << endl;
  exit(1);
 }
 …
}

  (3)為new和malloc設定異常處理函數。例如Visual C++可以用_set_new_hander函數為new設定使用者自己定義的異常處理函數,也可以讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。

  上述(1)(2)方式使用最普遍。如果一個函數內有多處需要申請動態記憶體,那麼方式(1)就顯得力不從心(釋放記憶體很麻煩),應該用方式(2)來處理。

  很多人不忍心用exit(1),問:“不編寫出錯處理常式,讓作業系統自己解決行不行?”

  不行。如果發生“記憶體耗盡”這樣的事情,一般說來應用程式已經無藥可救。如果不用exit(1) 把壞程式殺死,它可能會害死作業系統。道理如同:如果不把歹徒擊斃,歹徒在老死之前會犯下更多的罪。

  有一個很重要的現象要告訴大家。對於32位以上的應用程式而言,無論怎樣使用malloc與new,幾乎不可能導致“記憶體耗盡”。我在Windows 98下用Visual C++編寫了測試程式,見樣本7。這個程式會無休止地運行下去,根本不會終止。因為32位作業系統支援“虛存”,記憶體用完了,自動用硬碟空間頂替。我只聽到硬碟嘎吱嘎吱地響,Window 98已經累得對鍵盤、滑鼠毫無反應。

  我可以得出這麼一個結論:對於32位以上的應用程式,“記憶體耗盡”錯誤處理程式毫無用處。這下可把Unix和Windows程式員們樂壞了:反正錯誤處理程式不起作用,我就不寫了,省了很多麻煩。

  我不想誤導讀者,必須強調:不加錯誤處理將導致程式的品質很差,千萬不可因小失大。

void main(void)
{
 float *p = NULL;
 while(TRUE)
 {
  p = new float[1000000];
  cout << “eat memory” << endl;
  if(p==NULL)
   exit(1);
 }
}

  樣本7試圖耗盡作業系統的記憶體

  8、malloc/free 的使用要點

  函數malloc的原型如下:

void * malloc(size_t size);

  用malloc申請一塊長度為length的整數類型的記憶體,程式如下:

int *p = (int *) malloc(sizeof(int) * length);

  我們應當把注意力集中在兩個要素上:“類型轉換”和“sizeof”。

  * malloc傳回值的類型是void *,所以在調用malloc時要顯式地進行類型轉換,將void * 轉換成所需要的指標類型。

  * malloc函數本身並不識別要申請的記憶體是什麼類型,它只關心記憶體的總位元組數。我們通常記不住int, float等資料類型的變數的確切位元組數。例如int變數在16位系統下是2個位元組,在32位下是4個位元組;而float變數在16位系統下是4個位元組,在32位下也是4個位元組。最好用以下程式作一次測試:

cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;

  在malloc的“()”中使用sizeof運算子是良好的風格,但要當心有時我們會昏了頭,寫出 p = malloc(sizeof(p))這樣的程式來。

  * 函數free的原型如下:

void free( void * memblock );

  為什麼free函數不象malloc函數那樣複雜呢?這是因為指標p的類型以及它所指的記憶體的容量事先都是知道的,語句free(p)能正確地釋放記憶體。如果p是NULL指標,那麼free對p無論操作多少次都不會出問題。如果p不是NULL指標,那麼free對p連續操作兩次就會導致程式運行錯誤。

  9、new/delete 的使用要點

  運算子new使用起來要比函數malloc簡單得多,例如:

int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];

  這是因為new內建了sizeof、類型轉換和型別安全檢查功能。對於非內部資料類型的對象而言,new在建立動態對象的同時完成了初始化工作。如果對象有多個建構函式,那麼new的語句也可以有多種形式。例如

class Obj
{
 public :
  Obj(void); // 無參數的建構函式
  Obj(int x); // 帶一個參數的建構函式
  …
}
void Test(void)
{
 Obj *a = new Obj;
 Obj *b = new Obj(1); // 初值為1
 …
 delete a;
 delete b;
}

  如果用new建立對象數組,那麼只能使用對象的無參數建構函式。例如

Obj *objects = new Obj[100]; // 建立100個動態對象

  不能寫成

Obj *objects = new Obj[100](1);// 建立100個動態對象的同時賦初值1

  在用delete釋放對象數組時,留意不要丟了符號‘[]’。例如

delete []objects; // 正確的用法
delete objects; // 錯誤的用法

  後者相當於delete objects[0],漏掉了另外99個對象。

  10、一些心得體會

  我認識不少技術不錯的C++/C程式員,很少有人能拍拍胸脯說通曉指標與記憶體管理(包括我自己)。我最初學習C語言時特別怕指標,導致我開發第一個應用軟體(約1萬行C代碼)時沒有使用一個指標,全用數組來頂替指標,實在蠢笨得過分。躲避指標不是辦法,後來我改寫了這個軟體,代碼量縮小到原先的一半。

  我的經驗教訓是:

  (1)越是怕指標,就越要使用指標。不會正確使用指標,肯定算不上是合格的程式員。

  (2)必須養成“使用調試器逐步跟蹤程式”的習慣,只有這樣才能發現問題的本質。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.