7.7 杜絕“野指標”
“野指標”不是NULL指標,是指向“垃圾”記憶體的指標。人們一般不會錯用NULL指標,因為
用if語句很容易判斷。但是“野指標”是很危險的,if語句對它不起作用。
“野指標”的成因主要有兩種:
(1)指標變數沒有被初始化。任何指標變數剛被建立時不會自動成為NULL指標,它的預設值是隨機的,它會亂指一氣。所以,指標變數在建立的同時應當被初始化,要麼將指標設定為NULL,要麼讓它指向合法的記憶體。例如
char *p = NULL;
char *str = (char *) malloc(100);
(2)指標p被free或者delete之後,沒有置為NULL,讓人誤以為p是個合法的指標。參見7.5節。
(3)指標操作超越了變數的作用範圍。這種情況讓人防不勝防,樣本程式如下:
class A
{
public:
void Func(void){ cout << “Func of class A” << endl; }
};
void Test(void)
{
A *p;
{
A a;
p = &a; // 注意 a 的生命期
}
p->Func(); // p是“野指標”
}
函數Test在執行語句p->Func()時,對象a已經消失,而p是指向a的,所以p就成了“野指標”。但奇怪的是我運行這個程式時居然沒有出錯,這可能與編譯器有關。
7.8 有了malloc/free為什麼還要new/delete ?
malloc與free是C++/C語言的標準庫函數,new/delete是C++的運算子。它們都可用於申請動態記憶體和釋放記憶體。
對於非內部資料類型的對象而言,光用maloc/free無法滿足動態對象的要求。對象在建立的同時要自動執行建構函式,對象在消亡之前要自動執行解構函式。由於malloc/free是庫函數而不是運算子,不在編譯器控制許可權之內,不能夠把執行建構函式和解構函式的任務強加於malloc/free。
因此C++語言需要一個能完成動態記憶體分配和初始化工作的運算子new,以及一個能完成清理與釋放記憶體工作的運算子delete。注意new/delete不是庫函數。我們先看一看malloc/free和new/delete如何?對象的動態記憶體管理,見樣本7-8。
class Obj
{
public :
Obj(void){ cout << “Initialization” << endl; }
~Obj(void){ cout << “Destroy” << endl; }
void Initialize(void){ cout << “Initialization” << endl; }
void Destroy(void){ cout << “Destroy” << endl; }
};
void UseMallocFree(void)
{
Obj *a = (obj *)malloc(sizeof(obj)); // 申請動態記憶體
a->Initialize(); // 初始化
//…
a->Destroy(); // 清除工作
free(a); // 釋放記憶體
}
void UseNewDelete(void)
{
Obj *a = new Obj; // 申請動態記憶體並且初始化
//…
delete a; // 清除並且釋放記憶體
}
樣本7-8 用malloc/free和new/delete如何?對象的動態記憶體管理
類Obj的函數Initialize類比了建構函式的功能,函數Destroy類比了解構函式的功能。函數UseMallocFree中,由於malloc/free不能執行建構函式與解構函式,必須調用成員函數Initialize和Destroy來完成初始化與清除工作。函數UseNewDelete則簡單得多。
所以我們不要企圖用malloc/free來完成動態對象的記憶體管理,應該用new/delete。由於內部資料類型的“對象”沒有構造與析構的過程,對它們而言malloc/free和new/delete是等價的。
既然new/delete的功能完全覆蓋了malloc/free,為什麼C++不把malloc/free淘汰出局呢?這是因為C++程式經常要調用C函數,而C程式只能用malloc/free管理動態記憶體。
如果用free釋放“new建立的動態對象”,那麼該對象因無法執行解構函式而可能導致程式出錯。如果用delete釋放“malloc申請的動態記憶體”,理論上講程式不會出錯,但是該程式的可讀性很差。所以new/delete必須配對使用,malloc/free也一樣。
7.9 記憶體耗盡怎麼辦?
如果在申請動態記憶體時找不到足夠大的記憶體塊,malloc和new將返回NULL指標,宣告記憶體申請失敗。通常有三種方式處理“記憶體耗盡”問題。
(1)判斷指標是否為NULL,如果是則馬上用return語句終止本函數。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
return;
}
…
}
(2)判斷指標是否為NULL,如果是則馬上用exit(1)終止整個程式的運行。例如:
void Func(void)
{
A *a = new A;
if(a == NULL)
{
cout << “Memory Exhausted” << endl;
exit(1);
}
…
}
(3)為new和malloc設定異常處理函數。例如Visual C++可以用_set_new_hander函數為new設定使用者自己定義的異常處理函數,也可以讓malloc享用與new相同的異常處理函數。詳細內容請參考C++使用手冊。
上述(1)(2)方式使用最普遍。如果一個函數內有多處需要申請動態記憶體,那麼方式(1)就顯得力不從心(釋放記憶體很麻煩),應該用方式(2)來處理。
很多人不忍心用exit(1),問:“不編寫出錯處理常式,讓作業系統自己解決行不行?”
不行。如果發生“記憶體耗盡”這樣的事情,一般說來應用程式已經無藥可救。如果不用exit(1) 把壞程式殺死,它可能會害死作業系統。道理如同:如果不把歹徒擊斃,歹徒在老死之前會犯下更多的罪。
有一個很重要的現象要告訴大家。對於32位以上的應用程式而言,無論怎樣使用malloc與new,幾乎不可能導致“記憶體耗盡”。我在Windows 98下用Visual C++編寫了測試程式,見樣本7-9。這個程式會無休止地運行下去,根本不會終止。因為32位作業系統支援“虛存”,記憶體用完了,自動用硬碟空間頂替。我只聽到硬碟嘎吱嘎吱地響,Window 98已經累得對鍵盤、滑鼠毫無反應。
我可以得出這麼一個結論:對於32位以上的應用程式,“記憶體耗盡”錯誤處理程式毫無用處。這下可把Unix和Windows程式員們樂壞了:反正錯誤處理程式不起作用,我就不寫了,省了很多麻煩。
我不想誤導讀者,必須強調:不加錯誤處理將導致程式的品質很差,千萬不可因小失大。
void main(void)
{
float *p = NULL;
while(TRUE)
{
p = new float[1000000];
cout << “eat memory” << endl;
if(p==NULL)
exit(1);
}
}
樣本7-9試圖耗盡作業系統的記憶體
7.10 malloc/free 的使用要點
函數malloc的原型如下:
void * malloc(size_t size);
用malloc申請一塊長度為length的整數類型的記憶體,程式如下:
int *p = (int *) malloc(sizeof(int) * length);
我們應當把注意力集中在兩個要素上:“類型轉換”和“sizeof”。
* malloc傳回值的類型是void *,所以在調用malloc時要顯式地進行類型轉換,將void * 轉換成所需要的指標類型。
* malloc函數本身並不識別要申請的記憶體是什麼類型,它只關心記憶體的總位元組數。我們通常記不住int, float等資料類型的變數的確切位元組數。例如int變數在16位系統下是2個位元組,在32位下是4個位元組;而float變數在16位系統下是4個位元組,在32位下也是4個位元組。最好用以下程式作一次測試:
cout << sizeof(char) << endl;
cout << sizeof(int) << endl;
cout << sizeof(unsigned int) << endl;
cout << sizeof(long) << endl;
cout << sizeof(unsigned long) << endl;
cout << sizeof(float) << endl;
cout << sizeof(double) << endl;
cout << sizeof(void *) << endl;
在malloc的“()”中使用sizeof運算子是良好的風格,但要當心有時我們會昏了頭,寫出 p = malloc(sizeof(p))這樣的程式來。
* 函數free的原型如下:
void free( void * memblock );
為什麼free函數不象malloc函數那樣複雜呢?這是因為指標p的類型以及它所指的記憶體的容量事先都是知道的,語句free(p)能正確地釋放記憶體。如果p是NULL指標,那麼free對p無論操作多少次都不會出問題。如果p不是NULL指標,那麼free對p連續操作兩次就會導致程式運行錯誤。
7.11 new/delete 的使用要點
運算子new使用起來要比函數malloc簡單得多,例如:
int *p1 = (int *)malloc(sizeof(int) * length);
int *p2 = new int[length];
這是因為new內建了sizeof、類型轉換和型別安全檢查功能。對於非內部資料類型的對象而言,new在建立動態對象的同時完成了初始化工作。如果對象有多個建構函式,那麼new的語句也可以有多種形式。例如
class Obj
{
public :
Obj(void); // 無參數的建構函式
Obj(int x); // 帶一個參數的建構函式
…
}
void Test(void)
{
Obj *a = new Obj;
Obj *b = new Obj(1); // 初值為1
…
delete a;
delete b;
}
如果用new建立對象數組,那麼只能使用對象的無參數建構函式。例如
Obj *objects = new Obj[100]; // 建立100個動態對象
不能寫成
Obj *objects = new Obj[100](1);// 建立100個動態對象的同時賦初值1
在用delete釋放對象數組時,留意不要丟了符號‘[]’。例如
delete []objects; // 正確的用法
delete objects; // 錯誤的用法
後者相當於delete objects[0],漏掉了另外99個對象。
7.12 一些心得體會
我認識不少技術不錯的C++/C程式員,很少有人能拍拍胸脯說通曉指標與記憶體管理(包括我自己)。我最初學習C語言時特別怕指標,導致我開發第一個應用軟體(約1萬行C代碼)時沒有使用一個指標,全用數組來頂替指標,實在蠢笨得過分。躲避指標不是辦法,後來我改寫了這個軟體,代碼量縮小到原先的一半。
我的經驗教訓是:
(1)越是怕指標,就越要使用指標。不會正確使用指標,肯定算不上是合格的程式員。
(2)必須養成“使用調試器逐步跟蹤程式”的習慣,只有這樣才能發現問題的本質。