標籤:nagios
一、什麼是nagios
1.nagios 簡介
Nagios是一個監視系統運行狀態和網路資訊的監視系統。Nagios能監視所指定的本地或遠程主機以及服務,同時提供異常通知功能等。Nagios可運行在Linux/Unix平台之上,同時提供一個可選的基於瀏覽器的WEB介面以方便系統管理人員查看網路狀態,各種系統問題,以及日誌等等。
Nagios是十分受歡迎的、開源且免費的電腦及網路系統監視軟體。Nagios是“Nagios Ain‘t Gonna Insist On Sainthood”的縮寫。它最早是在1999年以“NetSaint”發布。Nagios主要應用在Linux和Unix平台環境下的監控,但通過外掛程式,也可以監控MS Windows系統的主機。Nagios在LinuxCon 2010 Poll並選為最受歡迎的IT營運工具。它被Infoworld在2009年評為最佳開源軟體,同時也是該年度的SourceForge社區的系統管理工具最佳選擇。Nagios也被很多知名企業所採用,包括AOL,DHL,At&t,歐萊雅,德州儀器,Siemens COM CZ,時代華納有線,Yahoo等。
2.Nagios的主要功能特點:
- 監視網路服務 (SMTP, POP3, HTTP, NNTP, PING等)
- 監視主機資源 (進程, 磁碟等)
- 簡單的外掛程式設計可以輕鬆擴充Nagios的監視功能
- 服務等監視的並發處理
- 錯誤通知功能 (通過email, pager, 或其他使用者自訂方法)
- 可指定自訂的事件處理控制器
- 可選的基於瀏覽器的WEB介面以方便系統管理人員查看網路狀態,各種系統問題,以及日誌等等
- 可以通過手機查看系統監控資訊
服務端(222.105.134.103)
rpm安裝nagios首先需要安裝擴充yum源
rpm -y install epel-release
rpm安裝nagios
yum install -y httpd nagios nagios-pluginx nagios-plugins-all nrpe nagios-plugins-nrpe
安裝後配置nagios登入密碼
[[email protected] ]# htpasswd -c /etc/nagios/passwd nagiosadmin
New password:
Re-type new password:
Adding password for user nagiosadmin
修改nagios設定檔
vim /etc/nagios/nagios.cfg
檢測設定檔是否正確
nagios -v /etc/nagios/nagios.cfg
啟動http和nagios
service httpd start;service nagios start
清除防火牆配置:iptables -F
瀏覽器訪問http://ip/nagios
用戶端配置(222.105.134.102)
搭建配置nagios
配置擴充源rpm -y install epel-release
rpm安裝nagios
yum install -y httpd nagios nagios-pluginx nagios-plugins-all nrpe nagios-plugins-nrpe
vim /etc/nagios/nrpe.cfg 找到 “allowed_hosts=127.0.0.1”添加成"allowed_hosts=127.0.0.1,222.105.134.103" #加入服務機的ip
找到"dont_blame_nrpe=0"改為"dont_blame_nrpe=1"
啟動用戶端:service nagios start
在服務端本地監控客戶機上本地才能監控的服務時,需佈建服務端nagios設定檔,添加如下內容:
[[email protected] ]# vi /etc/nagios/objects/commands.cfg
define command{
command_name check_nrpe
command_line $USER1$/check_nrpe -H $HOSTADDRESS$ -c $ARG1$
}
服務端添加被監控主機(222.105.134.102)監控的項目
cd /etc/nagios/conf.d/
vim 222.105.134.102.cfg
define host { use linux-server ;定義監控主機 host_name 222.105.134.102 alias 134.102 address 222.105.134.102 } define service { use generic-service host_name 222.105.134.102 service_description check_ping check_command check_ping!10.020%!200.0,50% max_check_attempts 5 normal_check_interval 1 } define service { use generic-service host_name 222.105.134.102 service_description check_ssh check_command check_ssh max_check_attempts 5 #當nagios檢測到問題時,一共嘗試檢測5次都有問題才會警示,如果該數值為1,那麼檢測到問題立即警示 normal_check_interval 1 #重新檢測的時間間隔,單位是分鐘,預設是3分鐘 notification_interval 60 #在服務出現異常後,故障一直沒有解決,nagios再次對使用者發出通知的時間。單位是分鐘。如果你認為,所有的事件只需要一次通知就夠了,可以把這裡的選項設為0。 }define service{ use generic-service host_name 222.105.134.102 service_description check_http check_command check_http max_check_attempts 5 normal_check_interval 1 } define service { use generic-service host_name 222.105.134.102 service_description check_load check_command check_nrpe!check_load max_check_attempts 5 normal_check_interval 1} define service { use generic-service host_name 222.105.134.102 service_description check_disk_hda1 check_command check_nrpe!check_hda1 max_check_attempts 5 normal_check_interval 1} define service { use generic-service host_name 222.105.134.102 service_description check_disk_hda2 check_command check_nrpe!check_hda2 max_check_attempts 5 normal_check_interval 1}
監控磁碟是修改服務端的/etc/nagios/nrpe.cfg設定檔,修改如下所示
command[check_hda1]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/hda1command[check_hda2]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/hda2修改成:command[check_hda1]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda1command[check_hda2]=/usr/lib64/nagios/plugins/check_disk -w 20% -c 10% -p /dev/sda2
即系統磁碟分割號必須要和設定檔中的分區號一致
寫入完成後 服務端重啟nagios服務:/etc/init.d/nagios restart
用戶端重啟nrep服務:/etc/init.d/nrep restart
本文出自 “linux窩” 部落格,請務必保留此出處http://xiangcc.blog.51cto.com/10201823/1700675
nagios監控安裝