仲介交易 HTTP://www.aliyun.com/zixun/aggregation/6858.html">SEO診斷 淘寶客 雲主機 技術大廳
俗語說「人心不足蛇吞象」,在上篇滿足基本要求後,需要滿足更高級的功能要求。
1、多個地點和線路同時監控
多個監控地點是指同時在不同地方對網站和伺服器進行監控,如在廣州、北京、重慶等多個點同時進行監控,任何一個點監控到故障都會告警。 多線路是指用不同線路(電信、聯通、鐵通等)同時進行監控。 地點和線路是組合一起使用,如廣州電信、北京聯通等。
中國互聯網人為的劃分為南北,南方主要是電信、北方主要是聯通(以前的網通),還有其它教育網、鐵通等。 不同網路線路存取速度比同一網路線路的要慢和不穩定,如電信訪問聯通要比電信訪問電信慢幾倍,並不時會出現互聯不通的情況。 再加上地點不同,情況更複雜。 如在廣州Ping廣州電信一般是10ms,Ping廣州聯通一般是30ms,Ping北京電信是20ms,Ping北京網通是60ms。 我們在廣州經常會監控到廣州電信線路不能訪問廣州聯通線路的情況。
大部分站長和網管自己沒條件進行多個地點和線路監控,線上監控輕而易舉幫你解決這個問題。 如你的網站伺服器是面向全國的,更需要多地點和線路監控。
2、故障告警支援主要告警和次要告警
伺服器一般同時開通多種服務,如網站服務、郵件服務、FTP服務、資料庫服務等,網管們喜歡能同時監控這些服務是否正常。 如果不分主次的話,當伺服器出現網路故障或者維護重啟時候,你會立即收到網站故障告警、郵件服務告警、FTP服務告警...,更慘是這台伺服器短時不能恢復時候,告警訊息源源不斷發給你,直到伺服器恢復正常或者你崩潰為止。
對於監控同一台伺服器的服務,需要定義一個主要監控物件,當主要監控物件出現故障,只發送主要監控物件的告警,其它次要的監控物件暫停監控和告警。 例如用Ping來做主要監控物件,如果Ping不通出現Timeout,表示伺服器已經當機或者斷網,這時只發送伺服器Ping告警持續監控Ping,因為再繼續監控和告警其它服務已經沒有必要。 這樣能大大減少告警消息數量,又讓監控更加合理、更加有效率。
3、自訂告警條件
一般的監控到的結果是成功或者失敗,如Ping不通、訪問網頁出錯、連接不到Socket,發生時這些稱之為故障,故障是最優先的告警。 除此之外,還能監控到返回的延時、內容等,如Ping返回的延時、訪問網頁的時間、訪問網頁取到的內容等。 利用返回的結果可以自訂告警條件,如Ping監控的返回延時一般是10-30ms之間,當延時大於100ms時候,表示網路或者伺服器可能出現問題,引起網路回應慢,需要立即檢查是否流量過大或者伺服器CPU太高等問題。
自訂告警條件能更加細化監控內容,精確知道網站和伺服器狀態,在故障準備發生前爭取到更多時間去解決問題。
4、自訂告警消息內容
告警消息內容非常多,如告警網站名、伺服器IP、監控的線路、監控的服務、出錯資訊、發生時間等,自訂告警消息內容能自由選擇收到的告警內容,修改為完全適合自己的實際要求。 這點對於用短信接受告警內容特別有意義,短信內容最多是70個字元,要在70個字元完全知道故障內容比較困難,更需要能自訂內容,調整為在有限字元內容下也能知道故障時間、故障內容,如:「 007電影網12:32電信線路監控第到1次失敗」,清晰明瞭的知道故障資訊。
5、通過郵件接收匯總報表
當網站和伺服器沒多大問題時候,大家都懶得登錄到線上監控服務管理後臺查看。 如果每天能收到一封網站伺服器監控的匯總報表郵件,花個兩三分鐘就大致瞭解網站和伺服器狀態。
6、被動監控
主動監控雖然能不需要安裝代碼和程式,非常安全和方便,但缺少很多細緻的監控內容,如無法獲取硬碟大小、CPU的使用率、網路的流量等,這些監控內容非常有用,如CPU太高表示有網站或者程式出問題,流量太高表示可能被攻擊等。
被動監控常用的是SNMP(簡單網路管理協定),通過SNMP能監控到大部分你感興趣的內容。 大部分作業系統支援SNMP,開通管理非常方便,也非常安全。 SNMP缺點是比較佔用頻寬,會消耗一定的CPU和記憶體,在CPU太高和網路流量大情況下,無法有效進行監控。
本文作者:中域互聯應用與服務(HTTP://www.118cy.com)在admin5原創首發,轉載留下文章出處。
上一篇《談線上網站伺服器監控(二)之使用的基本功能要求》