自從七十年代C語言誕生以來,一直以其靈活性、高效率和可移植性為軟體開發人員所鐘愛,成為系統軟體開發的首選工具。而C++作為C語言的繼承和發展,不僅保留了C語言的高度靈活、高效率和易於理解等諸多優點,還包含了幾乎所有物件導向的特徵,成為新一代軟體系統構建的利器。
相對來說,C語言是一種簡潔的語言,所涉及的概念和元素比較少,主要是:宏(macro)、指標(pointer)、結構(struct)、函數(function)和數組(array),比較容易掌握和理解。而C++不僅包含了上面所提到的元素,還提供了私人成員(private members)、公有成員(public members)、函數重載(function overloading)、預設參數(default parameters)、建構函式、解構函式、對象的引用(references)、操作符重載(operator overloading)、友元(friends)、模板(templates)、異常處理(exceptions)等諸多的要素,給程式員提供了更大的設計空間,同時也增加了軟體設計的難度。
C語言之所以能被廣泛的應用,其高效率是一個不可忽略的原因,C語言的效率能達到組合語言的80%以上,對於一種進階語言來說,C語言的高效率就不言而喻了。那麼,C++相對於C來說,其效率如何呢?實際上,C++的設計者stroustrup要求C++效率必須至少維持在與C相差5%以內,所以,經過精心設計和實現的C++同樣有很高的效率,但並非所有C++程式具有當然的高效率,由於C++的特殊性,一些不好的設計和實現習慣依然會對系統的效率造成較大的影響。同時,也由於有一部分程式員對C++的一些底層實現機制不夠瞭解,就不能從原理上理解如何提高軟體系統的效率。
本文主要討論兩個方面的問題:第一,對比C++的函數調用和C函數調用,解析C++的函數調用機制;第二,例舉一些C++程式員不太注意的技術細節,解釋如何提高C++的效率。為方便起見,本文的討論以下面所描述的單一繼承為例(多重繼承有其特殊性,另作討論)。
class X { public: virtual ~X(); file://解構函式 virtual void VirtualFunc(); file://虛函數 inline int InlineFunc() { return m_iMember}; file://內嵌函式 void NormalFunc(); file://普通成員函數 static void StaticFunc(); file://靜態函數 private: int m_iMember; }; class XX: public X { public: XX(); virtual ~XX(); virtual void VirtualFunc(); private: String m_strName; int m_iMember2; };
C++的的函數分為四種:內嵌函式(inline member function)、靜態成員函數(static member function)、虛函數(virtual member function)和普通成員函數。
內嵌函式類似於C語言中的宏定義函數調用,C++編譯器將內嵌函式的函數體擴充在函數調用的位置,使內嵌函式看起來象函數,卻不需要承受函數調用的開銷,對於一些函數體比較簡單的內嵌函式來說,可以大大提高內嵌函式的調用效率。但內嵌函式並非沒有代價,如果內嵌函式體比較大,內嵌函式的擴充將大大增加目標檔案和可運行檔案的大小;另外,inline關鍵字對編譯器只是一種提示,並非一個強制指令,也就是說,編譯器可能會忽略某些inline關鍵字,如果被忽略,內嵌函式將被當作普通的函數調用,編譯器一般會忽略一些複雜的內嵌函式,如函數體中有複雜語句,包括迴圈語句、遞迴調用等。所以,內嵌函式的函數體定義要簡單,否則在效率上會得不償失。
靜態函數的調用,如下面的幾種方式:
X obj; X* ptr = &obj; obj.StaticFunc(); ptr->StaticFunc(); X::StaticFunc();
將被編譯器轉化為一般的C函數調用形式,如同這樣:
mangled_name_of_X_StaticFunc(); file://obj.StaticFunc(); mangled_name_of_X_StaticFunc(); // ptr->StaticFunc(); mangled_name_of_X_StaticFunc(); // X::StaticFunc();
mangled_name_of_X_StaticFunc()是指編譯器將X::StaticFunc()函數經過變形(mangled)後的內部名稱(C++編譯器保證每個函數將被mangled為獨一無二的名稱,不同的編譯器有不同的演算法,C++標準並沒有規定統一的演算法,所以mangled之後的名稱也可能不同)。可以看出,靜態函數的調用同普通的C函數調用有完全相同的效率,並沒有額外的開銷。
普通成員函數的調用,如下列方式:
X obj; X* ptr = &obj; obj.NormalFunc(); ptr->NormalFunc();
將被被編譯器轉化為如下的C函數調用形式,如同這樣。
mangled_name_of_X_NormalFunc(&obj); file://obj.NormalFunc(); mangled_name_of_X_NormalFunc(ptr); // ptr->NormalFunc();
可以看出普通成員函數的調用同普通的C調用沒有大的區別,效率與靜態函數也相同。編譯器將重新改寫函數的定義,增加一個const X* this參數將調用對象的地址傳送進函數。
虛函數的調用稍微複雜一些,為了支援多態性,實現運行時刻綁定,編譯器需要在每個對象上增加一個欄位也就是vptr以指向類的虛函數表vtbl,如類X的物件模型如所示(本文中對此不多做解釋,若想進一步瞭解,可以參考其它材料)。
虛函數的多態性只能通過對象指標或對象的引用調用來實現,如下的調用:
X obj; X* ptr = &obj; X& ref = obj; ptr->VirtualFunc(); ref.VirtualFunc();
將被C++編譯器轉換為如下的形式。
( *ptr->vptr[2] )(ptr); ( *ptr->vptr[2] )(&ref);
其中的2表示VirtualFunc在類虛函數表的第2個槽位。可以看出,虛函數的調用相當於一個C的函數指標調用,其效率也並未降低。
由以上的四個例子可以看出,C++的函數調用效率依然很高。但C++還是有其特殊性,為了保證物件導向語義的正確性,C++編譯器會在程式員所編寫的程式基礎上,做大量的擴充,如果程式員不瞭解編譯器背後所做的這些工作,就可能寫出效率不高的程式。對於一些繼承層次很深的衍生類別或在成員變數中包含了很多其它類對象(如XX中的m_strName變數)的類來說,對象的建立和銷毀的開銷是相當大的,比如XX類的預設建構函式,即使程式員沒有定義任何語句,編譯器依然會給其建構函式擴充以下代碼來保證對象語義的正確性:
XX::XX() { // 編譯器擴充代碼所要做的工作 1、 調用父類X的預設建構函式 2、 設定vptr指向XX類虛函數表 3、 調用String類的預設建構函式構造m_strName };
所以為了提高效率,減少不必要的臨時對象的產生、拖延暫時不必要的對象定義、用初始化代替賦值、使用建構函式初始化列表代替在建構函式中賦值等方法都能有效提高程式的運行效率。以下舉例說明:
1、 減少臨時對象的產生。如以傳送對象引用的方式代替傳值方式來定義函數的參數,如下例所示,傳值方式將導致一個XX臨時對象的產生
效率不高的做法
高效率做法 void Function( XX xx ) void Function( const XX& xx ) { { file://函數體 file://函數體 } }
2、 拖延暫時不必要的對象定義。在C中要將所有的局部變數定義在函數體頭部,考慮到C++中對象建立的開銷,這不是一個好習慣。如下例,如果大部分情況下bCache為"真",則拖延xx的定義可以大大提高函數的效率。
效率不高的做法 高效率做法 void Function( bool bCache ) void Function( bool bCache ) { { file://函數體 file://函數體 XX xx; if( bCache ) if( bCache ) {// do something without xx { return; // do something without xx } return; } file://對xx進行操作 XX xx; file://對xx進行操作 … return; return; } }
3、 可能情況下,以初始化代替先定義後賦值。如下例,高效率的做法會比效率不高的做法省去了cache變數的預設建構函式調用開銷。
效率不高的做法 高效率做法 void Function( const XX& xx ) void Function( const XX& xx ) { { XX cache; XX cache = xx; cache = xx ; } }
4、 在建構函式中使用成員變數的初始化列表代替在建構函式中賦值。如下例,在效率不高的做法中,XX的建構函式會首先調用m_strName的預設建構函式,再產生一個臨時的String object,用空串""初始化臨時對象,再以臨時對象賦值(assign)給m_strName,然後銷毀臨時對象。而高效的做法只需要調用一次m_strName的建構函式。
效率不高的做法 高效率做法 XX::XX() XX::XX() : m_strName( "" ) { { m_strName = ""; … … } }
類似的例子還很多,如何寫出高效的C++程式需要實踐和積累,但理解C++的底層運行機制是一個不可缺少的步驟,只要平時多學習和思考,編寫高效的C++程式是完全可行的。