標籤:
開發背景:
A公司裡有很多伺服器(>3000台),每台伺服器都有不同的用途,如DB Server、WEB Server、ESXI等,每個組使用其中的一批,每個組可能有多個伺服器管理員。現在問題出來了,如何集中的去管理這些伺服器,如何對伺服器進行資源的合理分配,如何第一時間擷取每個伺服器的運行狀態,如何瞭解每台伺服器啟動並執行服務情況,如何根據資源的使用方式去擴充異或重新採購伺服器……。很多問題隨著伺服器的增多,使用用途的多樣性應運而生。因此,現在我所描述的這個平台就是為瞭解決上面的問題而來的。
目前現狀:
也許很多ops會說,現在不是有眾多成熟的監控工具嗎?隨便用一個好了。那麼請問,現在監控工具滿足你們的業務現狀嗎?可以針對你們公司的內部結構制定有效許可權控制嗎?所以說我們不能完全依賴於現有的工具,我們必須要創造自己的東西。
平台介紹:
功能,上面所說的統統都能解決。實現原理,之前已經發表過文章了,當然是基於nagios。瓶頸,那就也是nagios的瓶頸問題了,效能上暫時還沒突出,易用性,還可以,不太麻煩,技術,無法突破cgi及nagios的底層。雖然只是包了一層皮而已,但是如果你覺得把c/php/java搞在一起很容易嗎?那麼我也服你。每個工具或平台都有被人吐槽的地方,這也正常。
功能:
1.監控伺服器軟硬體資訊,cpu、記憶體、磁碟、網路運行狀態,WEB服務的運行情況,服務連接埠的暢通也是可以監控的,並且不需要安裝用戶端;
2.對監控的異常結果可以郵件警示,做到 第一時間告知你哪台伺服器或服務(連接埠異常,硬體異常)有問題;
3.可以對伺服器部署的應用進行自動或手動的啟停,自動的意思是定時監控服務的狀態,發現停止立馬啟動起來,保證服務準確高效運行;
4.可以清理日誌,自動或手動都可,及時釋放伺服器的磁碟空間很有用的;
5.管理伺服器及服務的歸屬關係,方便查詢和負責人的管理;
6.分組控制,每個組都可以管理自己的伺服器及服務資訊;
7.分許可權管理,分了遊客、管理員、系統管理員三個角色、
8.其它你能想到或想不到的。
展示圖:
請尊重作者的成果,轉載時註明出處。
意見及建議:[email protected]
企業級監控平台開發之nagios二次開發(七)