私有雲是雲計算自公共雲之後又一個廣泛運用的應用。 而私有雲的性能監控起著重要性的作用,不僅能診斷故障,在確保服務等級滿足集中化服務所需上也做出了不凡的貢獻。 為保證成功,聰明的IT人員經常創建高效率的虛擬化策略來完成私有雲的性能監控。
持續收集私有雲性能監控資料
私有雲不外乎就是是關於流程、自動化、人員管理和整合集中等內容。 一些私有雲使用虛擬化技術和物理宿主機,所以不管採用哪種工具完成性能監控,您都需要收集來自于各種宿主機的資料。 這樣持續地收集資料,不僅僅在整合、集中或故障診斷時才去做。
通常,使用者和監控系統在問題剛剛產生時不會察覺。 只有當問題變得嚴重足以影響到使用者使用後才被發現。 通過歷史資料,您可以看到問題產生的時間。 或許CPU負載的問題在一周前的病毒掃描程式升級完成後就產生了。 您可以在歷史資料中輕鬆發現這點,説明解決問題的人員快速地定位、修復和恢復到高效狀態。
私有雲性能監控還帶來一些非技術性收益。 您希望集中的一些服務,例如各部門的Web伺服器通常不會設置很多的監控。 當服務宕機或變慢時,很多部門的做法是簡單重啟。 而這種做法是錯誤的。
如果您推動集中服務的理由是通過監控提高可用性和性能,那麼各部門很難拒絕。 畢竟,您做了正確的事情,而他們沒有。
透明化
透明化也很重要。 把雲效能資料開放給開發人員和應用管理員,這樣他們可以看到自己所做配置選擇對性能的影響。 對基於虛擬化架構的雲而言,類似的一些選擇可能對應用本身是有益的,但卻影響到整個環境的性能。 IT系統也講究平衡,包括性能在內。 某個應用的性能目標應該用文檔記錄,這樣可以盡力去達到而不是超出。 超出這些目標需要額外的資金和時間投入。
選擇相關聯的資料獲取點對私有雲性能進行監控
當部署私有雲性能監控系統時,盡可能多地從正確的地點收集相關聯維度的資料。 不要從虛擬化環境中某台虛擬機器中獲取關於CPU負載的資訊,結果會是錯誤的。 您應該從虛擬化平臺角度去獲取準確資料。 同樣,記憶體使用率、網路I/O、存儲I/O等等也是這樣。
相反,應用性能最好從單個伺服器的級別上判斷,可以説明識別某個集群成員是否已超負荷。
另外,盡可能地以最小細微性收集資料。 很多性能監控工具以5、15或60分鐘的平均資料作為歷史資料,這體現到圖形上就使得峰值資料變得平緩。 這種平緩帶來一些假像,因為峰值資料意義重大。
當應用回應工作時,不是慢慢地進行,而是調用所有它可用的CPU資源盡可能快速地完成,在圖形上體現為100%的CPU使用率峰值。 峰值時間的長度非常重要,這通常代表最終使用者對應用快慢的感受。 換句話說,是請求和結果之間的延遲時間。
如果性能監視軟體把這些峰值跟閒置時間進行了平均,可能看到的是50%的CPU使用率,從而得到錯誤的結論認為性能可以滿足。 網路和存儲連接的工作方式類似。 假設某一分鐘100%的使用率,而下一分鐘為0%,那麼平均使用率為50%,看起來不是什麼問題。 這種情況下通過高解析度軟體進行深入分析很有必要。 當然保留大量的資料和收集高精度資料的過程也會消耗CPU、記憶體、網路和存儲資源,所以您需要找到平衡點。
【編輯推薦】
顛覆現有格局:未來雲計算影響無處不在如何應對雲計算系統宕機? 雲計算時代:運營商搭便車還是做火車頭業界評論:雲計算並非IT的敵人雲計算IaaS最新標準出爐微軟向雲計算轉型:這意味著什麼? 【責任編輯:鳶瑋 TEL:(010)68476606】