標籤:處理 核心 配置 個數 rap 技術分享 測試 目的 斷網
目的
監控要測試的windows伺服器的資源使用方式
A.添加計數器步驟
1、添加視圖,方法雙擊、拖動左側的Windows Rescources到右邊圖形區,或右鍵右側已有視圖,Open a New Graph,找到Windows Rescource,添加
2.右鍵已經添加的Windows Resource, 選擇Add Measurements...
3.快顯視窗中,點擊Add,彈出Add Machine中添加要監控系統((通常是壓測目標伺服器)的IP,選擇系統平台
點擊OK,如下
如果有需要,可以繼續添加Measurements
添加後,點擊OK,儲存
B.計數器重要指標說明(所有的閾值都是平均值)
一.處理器:
1)%processor time: 處理器時間/使用率的平均值(cpu)閾值範圍為:小於85%;當平均值大於85%或者值持續超過95%,懷疑處理器瓶頸。其圖偶爾走高達到100%,就要看其平均值,一般來說是沒問題的!
2)processor queue length:如果此processor queue length保持不變(>=n(核心數)+1)並且處理器的利用率平均值%processor time超過90%,很有可能存在處理器瓶頸;processor queue length超過n+1,processor time一直很低,那麼或許更應該去解決處理器阻塞的問題,這是效能一般不是瓶頸。
二.記憶體
1) MemoryAvailable MBytes:當前的可用記憶體,至少有1%的實體記憶體值!如果Windows系統中的可用記憶體小於實體記憶體的總數的1%,則記憶體可能是瓶頸。如果其可用記憶體走勢先下降後平穩再上升,表示正常,代表記憶體被使用,然後釋放。如果記憶體沒有被釋放,即下降後平穩沒有上升,代表記憶體沒被釋放,表示可能會記憶體流失。
2) 當處理器到記憶體中取資料(或代碼),如果出錯時,則稱為一個page fault。
A.如果所有資料(或代碼)在記憶體的其他位置找到,稱為軟性錯誤
B.如果該頁再記憶體中沒有找到,而在磁碟中找到,則稱為硬性錯誤(pages/sec)
C.系統可以再存在大量軟性錯誤的情況下正常運行。但是如果系統中存在大量的硬性錯誤,則會嚴重影響系統的運行和效能。一般來說,硬性錯誤(單位:個數)閾值為:記憶體的1%,即2G記憶體,硬性錯誤不要超過20個。軟性錯誤+硬性錯誤=page fault
3) Page Reads/sec(頁面的讀取率):為瞭解決硬性錯誤,從硬碟中讀取的次數!如果Page Read/sec持續大於實體記憶體的1%,表示記憶體不足!
4) Pages/sec指解析硬性錯誤從磁碟讀取或寫入磁碟的頁數,此值很高表示記憶體不足
三.系統(system)
① Context Switches/sec:次數較多,就會佔用系統資源。原因是程式碼效率低下或者系統結構設計缺陷!
四.物理磁碟(Physical Disk)
1) 磁碟利用率(%Disk time):效能調優核心點之一:盡量減少磁碟IO。
2) Avg.Disk Queue Length:磁碟讀取/寫入請求(所選磁碟在執行個體間隔中的列隊的)平均數。閾值為:不超過磁碟的1.5~2倍。要提高效能,可增加磁碟。
3) Disk Reads(Write)Bytes/s:如果超過幾十M或者上百M,則懷疑磁碟磁碟瓶頸。
五.Network Interface
a) Bytes Total/sec:判斷網路頻寬情況,可用該計數器和當前網路頻寬比較。(1Byte =8bits)。該值*8再與頻寬的一半進行比較,如果該值小於頻寬的一半,則一般認為網路沒有瓶頸,頻寬的單位為bits。
六.瓶頸判斷:
(一) 判斷記憶體流失的問題:(此種情況一般需要長時間運行)
如果發生了記憶體流失,process/private bytes計數器和process/working set 計數器的值往往會升高,同時MemoryAvailable MBytes的值會降低。
(二)判斷應用程式的問題
如果系統代碼效率低下或者結構設計有缺陷而導致大量的環境切換(context switches/sec顯示的環境切換次數太高),那麼就會佔用大量的系統資源。如果系統的輸送量降低並且cpu的使用率很高,並且此現象發生時切換水平在15000以上,那麼意味著上下文
七.經驗之談
a) 如果“逾時錯誤”達到90%以上,可能需要提高硬體設定
如果有較多的“內部服務錯誤”,則可能需要提高程式方面的存在的
Loadrunder情境設計篇——添加windows Resource計數器和指標說明