標籤:monitor
1.先用表格列舉一下我的監控對象和閥值:
監控對象 |
監控閥值 |
主 機 資 源 |
主機存活: check_ping |
-w 3000.0,80% -c 5000.0,100% -p 5(3000毫秒回應時間內, 丟包率超過80%警示告,5000毫秒回應時間內,丟包率超過 100%報危急,一共發送5個包) |
登入使用者: check_user |
-w 5 -c 10(w為警告,c為危急) |
系統負載: check_load |
-w 15,10,5 -c 30,25,20(1分鐘,5分鐘,15分鐘大於對應 的等待進程數則警告或危急) |
磁碟佔用率: check_disk |
-w 20% -c 10% -p /(根分區剩餘空間為總大小的20%警告, 10%危急,-p後是根分區) |
指令碼檢測磁碟I/O: check_iostat |
-w 5 –c 10 (磁碟I/O的iowait超過5%警示告,超過10%報危急) |
檢測殭屍進程: check_zombie _procs |
-w 5 -c 10 -s Z(有5個殭屍進程警示告,10個報危急) |
檢測總進程數: check_total_procs |
-w 150 -c 200(總進程到150個警告,200個報危急) |
指令碼檢測記憶體剩餘: check_mem |
-w 90% -c 95%(記憶體空閑率90%以上警示告,95%以上報危急) |
檢測交換分區使用率: check_swap |
-w 20% -c 10%(交換分區剩餘空間為總大小的20%警告, 10%危急) |
應 用 服 務 監 控 |
監控服務連接埠: check_tcp |
-H localhost2 -p 80(主機與對應的連接埠號碼) |
監控頁面回應時間: check_http |
-H localhost2 -u http:\/\/localhost2/test.jsp –w 5 –c 10(檢查頁面,超過5s警示告,超過10s報危急) |
指令碼檢測IP串連數: check_ips |
-w 200 –c 250(IP串連數超過200警示告,超過250報危急) |
流量 監控 |
監控server流量: Check_traffic |
-V 2c -C public -H localhost2 -I 2 -w 12,30 -c 15,35 -M –b(snmp版本,使用者,主機,對應網卡,警告閥值,危急閥值) |
本文出自 “Lonely(技術群:1991706)” 部落格,請務必保留此出處http://304076020.blog.51cto.com/7503470/1437190