摘要:示範了Visual C++ 2003 編譯器提供的眾多代碼最佳化功能中的幾項功能。
Microsoft Visual C++ Toolkit 2003 包含最佳化 C++ 編譯器。大多數開關相當簡明,並且已經在 Visual C++ 產品的多個版本中存在,但仍然有兩個開關比較新,並且無須重寫代碼就能夠顯著提高速度。它們是 /GL (Whole Program Optimization) 和 /G7(它能產生為 Pentium 4 或 AMD Athlon 最佳化的代碼)。還有一個選項 /arch:SSE2,它能產生針對 SSE2 寄存器和指令而最佳化的代碼。
範例程式碼經過了三項測試:
1.調用作為內聯候選函數的函數。
2.執行大量浮點乘法和加法運算。
3.執行大量整數乘法和加法運算。
完整程式最佳化
範例程式碼定義了兩個非常類似的函數:Add() 和 DisplayAdd()。DisplayAdd() 會顯示到螢幕,因此不太可能被內聯:
void DisplayAdd(int a, int b)
{
cout << a << " + " << b << " = " << a + b << endl;
cout << "Return address from " << __FUNCTION__
<< " " << _ReturnAddress() << endl;
}
_ReturnAddress 是一個內建函式,它報告控制將在何處返回。可使用它來標識內嵌函式。
Add() 在 gl-g7.cpp 中聲明,同時還聲明一個由它設定的全域變數:
void* inlineReturnAddress; // set in Add()
int Add(int a, int b); // implementation in module.cpp
實現位於 module.cpp 中:
int Add(int a, int b)
{
inlineReturnAddress = _ReturnAddress();
return a+b;
}
要編譯該程式且不使用 Whole Prgram Optimization,請使用以下命令列:
cl /O2 /ML /EHsc GL-G7.cpp module.cpp
要運行測試 1,請使用以下命令:
gl-g7 1
應該看到與以下內容類別似的輸出(數值地址會有所不同):
1 + 2 = 3
Return address from DisplayAdd 00401D0A
1 + 2 = 3
Return address from Add 00401D13
Return address from Test1 00402125
Add() 的返回地址與 Test1() 的返回地址不同:Add() 沒有被內聯。
現在,使用 /GL 重新編譯:
cl /O2 /ML /EHsc /GL GL-G7.cpp module.cpp
再次運行測試 1,應該看到如下所示的輸出:
1 + 2 = 3
Return address from DisplayAdd 00401242
1 + 2 = 3
Return address from Add 0040179F
Return address from Test1 0040179F
現在,Add() 和 Test1() 的返回地址相同:Add() 在 Test1() 內部內聯,即使它的代碼來自另一個檔案。