高效虛擬化策略實現私有雲的性能監控

來源:互聯網
上載者:User
關鍵字 性能監控 私有雲 虛擬化 可以 私有雲性能

私有雲性能監控非常重要,不僅能診斷故障,而且確保服務等級滿足集中化服務所需。 為保證成功,聰明的IT人員經常創建高效率的虛擬化策略來完成私有雲的性能監控。


持續收集私有雲性能監控資料


私有雲主要是關於流程、自動化、人員管理和整合集中等內容。 一些私有雲使用虛擬化技術和物理宿主機,所以無論採用哪種工具完成性能監控,您需要收集來自于各種宿主機的資料。 持續地收集資料而不是僅在整合、集中或故障診斷時才去做。


通常,使用者和監控系統在問題剛剛產生時不會察覺。 只有當問題變得嚴重足以影響到使用者使用後才被發現。 通過歷史資料,您可以看到問題產生的時間。 或許CPU負載的問題在一周前的病毒掃描程式升級完成後就產生了。 您可以在歷史資料中輕鬆發現這點,説明解決問題的人員快速地定位、修復和恢復到高效狀態。


私有雲性能監控還帶來一些非技術性收益。 您希望集中的一些服務,例如各部門的Web伺服器通常不會設置很多的監控。 當服務宕機或變慢時,很多部門的做法是簡單重啟。 而這種做法是錯誤的。


如果您推動集中服務的理由是通過監控提高可用性和性能,那麼各部門很難拒絕。 畢竟,您做了正確的事情,而他們沒有。


透明化


透明化也很重要。 把雲效能資料開放給開發人員和應用管理員,這樣他們可以看到自己所做配置選擇對性能的影響。 對基於虛擬化架構的雲而言,類似的一些選擇可能對應用本身是有益的,但卻影響到整個環境的性能。 IT系統也講究平衡,包括性能在內。 某個應用的性能目標應該用文檔記錄,這樣可以盡力去達到而不是超出。 超出這些目標需要額外的資金和時間投入。


選擇相關聯的資料獲取點對私有雲性能進行監控


當部署私有雲性能監控系統時,盡可能多地從正確的地點收集相關聯維度的資料。 不要從虛擬化環境中某台虛擬機器中獲取關於CPU負載的資訊,結果會是錯誤的。 您應該從虛擬化平臺角度去獲取準確資料。 同樣,記憶體使用率、網路I/O、存儲I/O等等也是這樣。


相反,應用性能最好從單個伺服器的級別上判斷,可以説明識別某個集群成員是否已超負荷。


另外,盡可能地以最小細微性收集資料。 很多性能監控工具以5、15或60分鐘的平均資料作為歷史資料,這體現到圖形上就使得峰值資料變得平緩。 這種平緩帶來一些假像,因為峰值資料意義重大。


當應用回應工作時,不是慢慢地進行,而是調用所有它可用的CPU資源盡可能快速地完成,在圖形上體現為100%的CPU使用率峰值。 峰值時間的長度非常重要,這通常代表最終使用者對應用快慢的感受。 換句話說,是請求和結果之間的延遲時間。


如果性能監視軟體把這些峰值跟閒置時間進行了平均,可能看到的是50%的CPU使用率,從而得到錯誤的結論認為性能可以滿足。 網路和存儲連接的工作方式類似。 假設某一分鐘100%的使用率,而下一分鐘為0%,那麼平均使用率為50%,看起來不是什麼問題。 這種情況下通過高解析度軟體進行深入分析很有必要。 當然保留大量的資料和收集高精度資料的過程也會消耗CPU、記憶體、網路和存儲資源,所以您需要找到平衡點。

(責任編輯:蒙遺善)

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.