遇到問題:nagios監控遠程主機linux的本地資訊:如記憶體,cpu,負載等
解決問題:NRPE監控資訊
承接http://mengsir.blog.51cto.com/2992083/1254272 Nagios+Cacti模組——NRPE監控linux本地資訊四)
被監控機:
1.修改nrpe.cfg
vi/var/www/html/nagios/etc/nrpe.cfg 這裡假設1.2.3.4是監控伺服器的ip地址)
allowed_hosts=127.0.0.1,1.2.3.4 //允許監控伺服器訪問,中間用逗號隔開。server_address=1.2.3.4 // 以單獨的守護進程運行
監控主機nagios主機)
1.設定檔vi /var/www/html/nagios/etc/objects/commands.cfg末尾增加如下內容
define command command_name check_nrpe command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ }
意義如下:
command_name check_nrpe 定義命令名稱為check_nrpe,在 services.cfg中要使用這個名稱 |
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$ 這是定義實際啟動並執行外掛程式程式.這個命令列的書寫要完全按照check_nrpe這個命令的用法.不知道用法的就用check_nrpe –h查看 |
2.在services.cfg中添加/var/www/html/nagios/etc/object/services.cfg)
define service { host_name test244-server service_description check-load check_command check_nrpe!check_load check_period 24x7 max_check_attempts 3 normal_check_interval 3 retry_check_interval 2 contact_groups deyougroup notification_interval 10 notification_period 24x7 notification_options w,u,c,r}
3.手動在nrpe.cfg中添加,也就是自訂NRPE命令.
現在我們要監控swap分區,如果空閑空間小於20%則為警告狀態—warning;如果小於10%則為嚴重狀態—critical.我們可以查得需要使用check_swap外掛程式,完整的命令列應該是下面這樣.
/usr/local/nagios/libexec/check_swap -w 20% -c 10%
4.在被監控機上增加check_swap命令的定義
vi /var/www/html/nagios/etc/nrpe.cfg
增加下面這一行
command[check_swap]=/var/www/html/nagios/libexec/check_swap -w 20% -c 10%
現在check_swap 就可以作為check_nrpe 的 –c 的參數使用了。
修改了設定檔,當然要重啟.但是如果你是以獨立的daemon啟動並執行nrpe,那麼需要手動重啟.如果你是在xinetd或者inetd下面啟動並執行,則不需要.
由於我們是xinetd下啟動並執行,所以不需要重啟服務
5.有關於check_load的用法及意義
這個外掛程式是用來檢測系統當前的cpu負載,使用的方法為
check_load [-r] -w WLOAD1,WLOAD5,WLOAD15 -cCLOAD1,CLOAD5,CLOAD15
在unix裡面負載的均值通常表示是1分鐘,5分鐘,15分鐘內平均有多少進處於等待狀態.
例如check_load -w 15,10,5 -c 30,25,20這個命令的意義如下
當1分鐘多於15個進程等待,5分鐘多於10個,15分鐘多於5個則為warning狀態當1分鐘多於30個進程等待,5分鐘多於25個,15分鐘多於20個則為critical狀態
本文出自 “濛sir的積累” 部落格,轉載請與作者聯絡!