標籤:nagios簡介與原理
1.
Nagios簡介
1.與cacti的區別
a) Cacti
1.Cacti比較著重於直觀資料的監控,易於產生圖形,用來監控網路流量、cpu使用率、硬碟使用率等可以說很在合適不過
2.通過SNMP監控資料
3.展示工具
4.用外掛程式來增加模組做監控
b) nagios
1.比較注重於主機和服務的監控,並且有很強大的發送警示資訊的功能
2.監控方式更多
3.配置靈活的監控工具
4.指令碼和agent做監控
2.監控對象
a) 主機、主機群組:伺服器、虛擬機器、網路裝置
b) 服務/資源,服務組:http服務、mysql服務、CPU資源、硬碟、記憶體資源
c) 連絡人,連絡人群組:管理員
d) 時段:時間範圍
e) 命令:監控某一對象的模板
對不同的監控對象,使用不同的腳步
對相同的監控對象,也可能使用不同的腳步
3.主要功能
網路服務監控(SMTP、POP3、HTTP、NNTP、ICMP、SNMP、FTP、SSH)
主機資源監控(CPU load、disk usage、system logs),也包括Windows主機(使用NSClient++ plugin)
可以指定自己編寫的Plugin通過網路收集資料來監控任何情況(溫度、警告……)
可以通過配置Nagios遠程執行外掛程式遠程執行指令碼
遠程監控支援SSH或SSL加通道方式進行監控
簡單的plugin設計允許使用者很容易的開發自己需要的檢查服務,支援很多開發語言(shell scripts、C++、Perl、ruby、Python、PHP、C#等)
包含很多圖形化資料Plugins(Nagiosgraph、Nagiosgrapher、PNP4Nagios等)
可並行服務檢查
能夠定義網路主機的層次,允許逐級檢查,就是從父主機開始向下檢查
當服務或主機出現問題時發出通告,可通過email, pager, sms 或任意使用者自訂的plugin進行通知
能夠自訂事件處理機制重新啟用出問題的服務或主機
自動日誌迴圈
支援冗餘監控
包括Web介面可以查看當前網路狀態,通知,問題曆史,記錄檔等
2.
Nagios工作原理
Nagios的功能是監控服務和主機,但是他自身並不包括這部分功能,所有的監控、檢測功能都是通過各種外掛程式來完成的。
啟動Nagios後,它會周期性的自動調用外掛程式去檢測伺服器狀態,同時Nagios會維持一個隊列,所有外掛程式返回來的狀態資訊都進入隊列,Nagios每次都從隊首開始讀取資訊,並進行處理後,把狀態結果通過web顯示出來。
Nagios提供了許多外掛程式,利用這些外掛程式可以方便的監控很多服務狀態。安裝完成後,在nagios主目錄下的/libexec裡放有nagios內建的可以使用的所有外掛程式,如,check_disk是檢查磁碟空間的外掛程式,check_load是檢查CPU負載的,等等。每一個外掛程式可以通過運行./check_xxx –h 來查看其使用方法和功能。
Nagios可以識別4種狀態返回資訊,即 0(OK)表示狀態正常/綠色、1(WARNING)表示出現警告/黃色、2(CRITICAL)表示出現非常嚴重的錯誤/紅色、3(UNKNOWN)表示未知錯誤/深黃色。Nagios根據外掛程式返回來的值,來判斷監控對象的狀態,並通過web顯示出來,以供管理員及時發現故障
四種監控狀態
正常 OK 綠色
警告 WARNING 黃色
嚴重 CRITICAL 紅色
未知錯誤 UNKOWN 深黃色
對於警示功能,如果監控系統發現問題不能警示那就沒有意義了,所以警示也是nagios很重要的功能之一。但是,同樣的,Nagios 自身也沒有警示部分的代碼,甚至沒有外掛程式,而是交給使用者或者其他相關開源項目組去完成的。
那麼nzgios如何管理遠端伺服器對象的。Nagios 系統提供了一個外掛程式NRPE。Nagios 通過周期性的運行它來獲得遠端伺服器的各種狀態資訊。
Nagios 通過NRPE 來遠端管理服務
1. Nagios 執行安裝在它裡面的check_nrpe 外掛程式,並告訴check_nrpe 去檢測哪些服務。
2. 通過SSL,check_nrpe 串連遠端機子上的NRPE daemon
3. NRPE 運行本地的各種外掛程式去檢測本地的服務和狀態(check_disk,..etc)
4. 最後,NRPE 把檢測的結果傳給主機端的check_nrpe,check_nrpe 再把結果送到Nagios狀態隊列中。
5. Nagios 依次讀取隊列中的資訊,再把結果顯示出來。
本文出自 “淩宇的技術部落格” 部落格,請務必保留此出處http://lampit.blog.51cto.com/12958178/1931046
nagios簡介與原理