標籤:style blog http io 檔案 資料 2014 art
本博文為原創,遵循CC3.0協議,轉載請註明出處:http://blog.csdn.net/lux_veritas/article/details/24766015
---------------------------------------------------------------------------------------------------------------------------------------------------------------------------------------
Bandwidth是一款記憶體頻寬基準測試程式,主要針對x86及x86_64平台,通過順序讀寫與隨機讀寫不同大小的資料區塊,測試系統的記憶體頻寬效能。
項目地址
Bandwidth提供了一套組合語言實現的支援庫,用來完畢體繫結構相關的特定操作,比如讀取某些寄存器的內容。
利用該彙編庫,檢測當前系統CPU的型號及支援的特性,並選擇對應的工作模式,如筆者機器的CPU為:
CPU family: GenuineIntelCPU features: MMX SSE SSE2 SSE3 SSSE3 SSE4.1 SSE4.2 XD Intel64
在主程式執行時,依據CPU特性選擇工作模式:
if (mode == SSE2) { print (L"(128-bit), size = "); } else if (mode == AVX) { print (L"(256-bit), size = "); } else {#ifdef __x86_64__ print (L"(64-bit), size = ");#else print (L"(32-bit), size = ");#endif }筆者的CPU支援SSE2,不支援AVX,故採用128bit的資料位元寬進行對應的記憶體讀寫操作。
以筆者的機器為例,測試主要分為下面幾個部分:
|-------|128bit |64bit |
|:-----:|:-----:|:----:|
|順序讀 | | |
|隨機讀 | | |
|順序寫 | | |
|隨機寫 | | |
能夠選擇是否旁路掉各級cache,筆者機器的CPU cache情況例如以下:
Cache 0: L1 data cache, line size 64, 8-ways, 64 sets, size 32kCache 1: L1 instruction cache, line size 64, 8-ways, 64 sets, size 32kCache 2: L2 unified cache, line size 64, 16-ways, 4096 sets, size 4096k
用於讀寫的資料區塊大小從128B逐漸增大到128MB,因為各級cache的大小不同,進行記憶體讀寫時,較小的資料區塊會存放在cache中,較大的資料區塊則會經過cache存放在主存中。所以,隨著資料區塊大小的添加,在幾個節點上頻寬的大小會有明顯的跳變,主要原因就是到達了各級cache的容量上限,而轉向下層儲存。bandwidth會將測試結果產生一個記錄檔,一張圖表,這樣的頻寬的跳變在圖表中有最直觀的表現。,在32KB與4MB處頻寬有明顯的下降趨勢