標籤:nagios ping 仲裁 多點監控
出發點:
因為nagios的nrpe外掛程式在檢測ping時,如果包過多,會有一個檢查逾時超過30個包nrpe socket就逾時了。
後來想了個辦法,在本地弄了個指令碼來ping 150個包,結合nagios 3分鐘檢查一次,指令碼ping出的結果整合後放到一個臨時檔案裡,讓nrpe在觸發時去檔案裡讀狀態,發警示。
問題來了,如果這台檢測的機器異常到目的節點丟包,會導致目標節點被誤判,與是乎就想到了仲裁伺服器。
仲裁節點一個,訊息佇列一個,各地檢測節點若干。
實現方法:
仲裁節點上部署個httpsqs,httpsqs是基於不同的KEY分別做隊列的,各地檢查節點部署ping指令碼,將結果整合後發送到訊息佇列,
仲裁節點根據不同的KEY取不同隊列然後判斷各節點的狀態,進行一個綜合判斷,來決定目標伺服器是否異常了。
部分指令碼代碼
650) this.width=650;" src="https://s2.51cto.com/oss/201711/16/2e53e28204d9002a078620f66083e39f.png-wh_500x0-wm_3-wmp_4-s_592955053.png" title="分布式節點上執行" alt="2e53e28204d9002a078620f66083e39f.png-wh_" />
判斷指令碼並交付nagios的
650) this.width=650;" src="https://s1.51cto.com/oss/201711/16/21c72b65378d05c889ce561b3091cc57.png-wh_500x0-wm_3-wmp_4-s_64780610.png" title="TIM圖片20171116151542.png" alt="21c72b65378d05c889ce561b3091cc57.png-wh_" />
監控
650) this.width=650;" src="https://s4.51cto.com/oss/201711/16/73edbbdffe2a4fa75d35fe1aaca92aab.png-wh_500x0-wm_3-wmp_4-s_754881099.png" title="TIM圖片20171116152404.png" alt="73edbbdffe2a4fa75d35fe1aaca92aab.png-wh_" />
本文出自 “KAMIO自動營運之路” 部落格,謝絕轉載!
nagios結合httpsqs做多點多包檢查ping監控