cortex-a8的vfp3指令執行速度

來源:互聯網
上載者:User

一、測試環境:

1、CPU主頻跑在1GHz,因為要測試VFP3指令所以需要將FPEXC的BIT30設為1;

2、作業系統使用WINCE6R3

3、編譯器使用VS2005、VS2008、WEC7三種

 二、測試代碼:

//--------------------------------------double FloatingPointArithmeticOne (DWORD i){int j;double a[256];a[0] = rand();a[1] = (i%256)+2;a[2] = a[0] + a[1];a[3] = a[2] / a[1];a[4] = a[3] - a[1];a[5] = a[4] * a[1];for (j = 0; j < 7; j++) {a[7] += a[j];}return a[7];}//--------------------------------------DWORD FloatingPointArithmetic (){DWORD dwTick;DWORD dwNow;DWORD i;DWORD j;double a = 0;dwTick = GetTickCount ();for (i = 0;; i++) {for (j = 0; j < 1000; j++) {a += FloatingPointArithmeticOne (j);}dwNow = GetTickCount ();if (dwNow - dwTick >= 1000)break;}return i;}int _tmain(int argc, _TCHAR* argv[]){DWORD ts = FloatingPointArithmetic();printf("FloatingPointArithmetic: ts = %d\n", ts);return 0;}

三、測試結果

1、VS2005編譯產生的程式:用IDA查看,產生的程式碼調用的浮點運算是coredll中的函數,也就是純軟體類比,ts值是270(次)

2、VS2008和WEC7編譯產生的程式:用IDA查看,產生的程式碼調用的浮點運算都是VFP硬體指令,不過WEC7最佳化的指令數更少,前者ts是1546(次),後者是1771(次)

四、其它

1、IDA需要使用6.1版,而且需要將ARM架構設定成ARMv7-A&R,這樣才能正確翻譯VFP3/NEON指令

2、可以通過指定VS2008執行程式優先路徑的方式來使用WEC7的編譯器進行編譯,然後指定編譯參數“/QRarch7 /QRfpe- /arch:VFPv3-D32”來進行編譯最佳化

3、對於彙編檔案,如果有VFP3或NEON指令因VS2008的編譯器無法識別則只能用WEC7的編譯器進行編譯;或者使用偽指令DCD

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.