一、測試環境:
1、CPU主頻跑在1GHz,因為要測試VFP3指令所以需要將FPEXC的BIT30設為1;
2、作業系統使用WINCE6R3
3、編譯器使用VS2005、VS2008、WEC7三種
二、測試代碼:
//--------------------------------------double FloatingPointArithmeticOne (DWORD i){int j;double a[256];a[0] = rand();a[1] = (i%256)+2;a[2] = a[0] + a[1];a[3] = a[2] / a[1];a[4] = a[3] - a[1];a[5] = a[4] * a[1];for (j = 0; j < 7; j++) {a[7] += a[j];}return a[7];}//--------------------------------------DWORD FloatingPointArithmetic (){DWORD dwTick;DWORD dwNow;DWORD i;DWORD j;double a = 0;dwTick = GetTickCount ();for (i = 0;; i++) {for (j = 0; j < 1000; j++) {a += FloatingPointArithmeticOne (j);}dwNow = GetTickCount ();if (dwNow - dwTick >= 1000)break;}return i;}int _tmain(int argc, _TCHAR* argv[]){DWORD ts = FloatingPointArithmetic();printf("FloatingPointArithmetic: ts = %d\n", ts);return 0;}
三、測試結果
1、VS2005編譯產生的程式:用IDA查看,產生的程式碼調用的浮點運算是coredll中的函數,也就是純軟體類比,ts值是270(次)
2、VS2008和WEC7編譯產生的程式:用IDA查看,產生的程式碼調用的浮點運算都是VFP硬體指令,不過WEC7最佳化的指令數更少,前者ts是1546(次),後者是1771(次)
四、其它
1、IDA需要使用6.1版,而且需要將ARM架構設定成ARMv7-A&R,這樣才能正確翻譯VFP3/NEON指令
2、可以通過指定VS2008執行程式優先路徑的方式來使用WEC7的編譯器進行編譯,然後指定編譯參數“/QRarch7 /QRfpe- /arch:VFPv3-D32”來進行編譯最佳化
3、對於彙編檔案,如果有VFP3或NEON指令因VS2008的編譯器無法識別則只能用WEC7的編譯器進行編譯;或者使用偽指令DCD