前面已經介紹了 vmstat和top命令的解析及使用,下面我們來學習一個更重要的命令sar
sar命令可以通過參數單獨查看系統某個局部的使用方式
sar 命令列的常用格式:
sar [options] [-A] [-o file] t [n]
在命令列中,n 和t 兩個參數組合起來定義採樣間隔和次數,t為採樣間隔,是必須有的參數,n為採樣次數,是可選的,預設值是1,-o file表示將命令結果以二進位格式存放在檔案中,
file 在此處不是關鍵字,是檔案名稱。options 為命令列選項,sar命令的選項很多,下面只列出常用選項:
-A:所有報告的總和。
-u:CPU利用率
-v:進程、I節點、檔案和鎖表狀態。
-d:硬碟使用報告。
-r:沒有使用的記憶體頁面和硬碟塊。
-g:串口I/O的情況。
-b:緩衝區使用方式。
-a:檔案讀寫情況。
-c:系統調用情況。
-R:進程的活動情況。
-y:終端裝置活動情況。
-w:系統交換活動。
-n: 記錄網路使用方式
預設監控: sar 5 5 // CPU和IOWAIT統計狀態
(1) sar -b 5 5 // IO傳送速率
(2) sar -B 5 5 // 頁交換速率
(3) sar -c 5 5 // 進程建立的速率
(4) sar -d 5 5 // 塊裝置的活躍資訊
(5) sar -n DEV 5 5 // 網路裝置的狀態資訊
(6) sar -n SOCK 5 5 // SOCK的使用方式
(7) sar -n ALL 5 5 // 所有的網路狀態資訊
(8) sar -P ALL 5 5 // 每顆CPU的使用狀態資訊和IOWAIT統計狀態
(9) sar -q 5 5 // 隊列的長度(等待啟動並執行進程數)和負載的狀態
(10) sar -r 5 5 // 記憶體和swap空間使用方式
(11) sar -R 5 5 // 記憶體的統計資訊(記憶體頁的分配和釋放、系統每秒作為BUFFER使用記憶體頁、每秒被cache到的記憶體頁)
(12) sar -u 5 5 // CPU的使用方式和IOWAIT資訊(同預設監控)
(13) sar -v 5 5 // inode, file and other kernel tablesd的狀態資訊
(14) sar -w 5 5 // 每秒上下文交換的數目
(15) sar -W 5 5 // SWAP交換的統計資訊(監控狀態同iostat 的si so)
(16) sar -x 2906 5 5 // 顯示指定進程(2906)的統計資訊,資訊包括:進程造成的錯誤、使用者級和系統級使用者CPU的佔用情況、運行在哪顆CPU上
(17) sar -y 5 5 // TTY裝置的活動狀態
(18) 將輸出到檔案(-o)和讀取記錄資訊(-f)
例1:oracle@oracle [/home/oracle] sar -u 1 0 -e 16:00:00 >data.txt //每隔1秒記錄CPU的使用方式,直到15點,資料將儲存到data.txt檔案中。(-e 參數表示結束時間,注意時間格式:必須為hh:mm:ss格式)
Linux 2.6.18-194.el5 (oracle) 10/11/2011
02:20:28 PM CPU %user %nice %system %iowait %steal %idle
02:20:29 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:30 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:31 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:32 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:33 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:34 PM all 0.00 0.00 0.25 0.00 0.00 99.75
02:20:35 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:36 PM all 0.00 0.00 0.00 0.00 0.00 100.00
02:20:37 PM all 0.25 0.00 0.00 0.00 0.00 99.75
02:20:38 PM all 0.00 0.00 0.00 0.00 0.00 100.00
Average: all 0.02 0.00 0.02 0.00 0.00 99.95
在不使用參數的情況下,系統預設列印CPU使用方式
%user: CPU處在使用者模式下的時間百分比。
%system:CPU處在系統模式下的時間百分比。
%iowait: CPU等待輸入輸出完成時間的百分比。
%idle: CPU空閑時間百分比。
在所有的顯示中,我們應主要注意%iowait和%idle,%iowait的值過高,表示硬碟存在I/O瓶頸,%idle值高,表示CPU較空閑,如果%idle值高但系統響應慢時,有可能是CPU等待分配記憶體,此時應加大記憶體容量。%idle值如果持續低於10,那麼系統的CPU處理能力相對較低,表明系統中最需要解決的資源是CPU。
在多CPU Linux系統中,sar命令也可以為每個CPU分解該資訊,採用如下命令:sar -u -P ALL 5 5
oracle@oracle [/home/oracle] sar -u -P ALL 5 2
Linux 2.6.18-194.el5 (oracle) 10/11/2011
02:41:20 PM CPU %user %nice %system %iowait %steal %idle
02:41:25 PM all 0.00 0.00 0.10 0.00 0.00 99.90
02:41:25 PM 0 0.00 0.00 0.20 0.00 0.00 99.80
02:41:25 PM 1 0.00 0.00 0.00 0.00 0.00 100.00
02:41:25 PM 2 0.20 0.00 0.20 0.00 0.00 99.60
02:41:25 PM 3 0.00 0.00 0.00 0.00 0.00 100.00
02:41:25 PM CPU %user %nice %system %iowait %steal %idle
02:41:30 PM all 0.00 0.00 0.05 0.00 0.00 99.95
02:41:30 PM 0 0.00 0.00 0.00 0.00 0.00 100.00
02:41:30 PM 1 0.00 0.00 0.00 0.00 0.00 100.00
02:41:30 PM 2 0.00 0.00 0.00 0.00 0.00 100.00
02:41:30 PM 3 0.00 0.00 0.00 0.00 0.00 100.0
例2: 使用命令 sar -v t n
oracle@oracle [/home/oracle] sar -v 30 5 //進程、I節點、檔案和鎖表狀態
Linux 2.6.18-194.el5 (oracle) 10/11/2011
02:28:45 PM dentunusd file-sz inode-sz super-sz %super-sz dquot-sz %dquot-sz rtsig-sz %rtsig-sz
02:29:15 PM 8675 9690 7119 0 0.00 0 0.00 0 0.00
02:29:45 PM 8676 9690 7119 0 0.00 0 0.00 0 0.00
02:30:15 PM 8677 9690 7119 0 0.00 0 0.00 0 0.00
02:30:45 PM 8684 9690 7126 0 0.00 0 0.00 0 0.00
02:31:15 PM 8685 9690 7126 0 0.00 0 0.00 0 0.00
Average: 8679 9690 7122 0 0.00 0 0.00 0 0.00
dentunusd:在緩衝目錄條目中沒有使用的條目數量.
file-nr:被系統使用的檔案控制代碼數量.
inode-nr:使用的索引節點數量.
pty-nr:使用的pty數量.
例3: 使用命令 sar -d t n
oracle@oracle [/home/oracle] sar -d 30 2 //查看裝置使用方式
Linux 2.6.18-194.el5 (oracle) 10/11/2011
02:30:33 PM DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util
02:31:03 PM dev8-0 47.95 12099.97 58.38 253.56 0.08 1.74 1.03 4.95
02:31:03 PM dev8-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:31:03 PM dev8-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:31:03 PM dev8-3 47.95 12099.97 58.38 253.56 0.08 1.74 1.03 4.95
02:31:03 PM DEV tps rd_sec/s wr_sec/s avgrq-sz avgqu-sz await svctm %util
02:31:33 PM dev8-0 38.67 9648.00 62.93 251.14 0.07 1.75 1.01 3.89
02:31:33 PM dev8-1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:31:33 PM dev8-2 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:31:33 PM dev8-3 38.67 9648.00 62.93 251.14 0.07 1.75 1.01 3.89
DEV 磁碟裝置
用參數-p可以列印出sda,hdc等磁碟裝置名稱,如果不用參數-p,裝置節點則有可能是dev8-0,dev22-0
tps:每秒從物理磁碟I/O的次數.多個邏輯請求會被合并為一個I/O磁碟請求,一次傳輸的大小是不確定的.
rd_sec/s:每秒讀扇區的次數.
wr_sec/s:每秒寫扇區的次數.
avgrq-sz:平均每次裝置I/O操作的資料大小(扇區).
avgqu-sz:磁碟請求隊列的平均長度.
await:從請求磁碟操作到系統完成處理,每次請求的平均消耗時間,包括請求隊列等待時間,單位是毫秒(1秒=1000毫秒).
svctm:系統處理每次請求的平均時間,不包括在請求隊列中消耗的時間.
%util:I/O請求占CPU的百分比,比率越大,說明越飽
例4: 使用命令 sar -n t n
oracle@oracle [/home/oracle] sar -n ALL 5 2
Linux 2.6.18-194.el5 (oracle) 10/11/2011
02:52:49 PM IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/ s rxmcst/s
02:52:54 PM lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM eth0 127.15 112.57 38894.41 20819.16 0.00 0.00 0.00
02:52:54 PM eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:49 PM IFACE rxerr/s txerr/s coll/s rxdrop/s txdrop/s txcarr/s rxfram/s rxfifo/s txfifo/s
02:52:54 PM lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:49 PM call/s retrans/s read/s write/s access/s getatt/s
02:52:54 PM 0.00 0.00 0.00 0.00 0.00 0.00
02:52:49 PM scall/s badcall/s packet/s udp/s tcp/s hit/s miss/s sread/s swrite/s saccess/s sgetatt/s
02:52:54 PM 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:49 PM totsck tcpsck udpsck rawsck ip-frag
02:52:54 PM 274 99 41 0 0
02:52:54 PM IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/s rxmcst/s
02:52:59 PM lo 0.40 0.40 20.00 20.00 0.00 0.00 0.00
02:52:59 PM eth0 139.00 120.60 47988.20 22587.00 0.00 0.00 0.00
02:52:59 PM eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:59 PM sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM IFACE rxerr/s txerr/s coll/s rxdrop/s txdrop/s txcarr/ s rxfram/s rxfifo/s txfifo/s
02:52:59 PM lo 0.00 0.00 0.00 0.00 0.00 0.0 0 0.00 0.00 0.00
02:52:59 PM eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:59 PM eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:59 PM sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM call/s retrans/s read/s write/s access/s getatt/s
02:52:59 PM 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM scall/s badcall/s packet/s udp/s tcp/s hit/s miss/s sread/s swrite/s saccess/s sgetatt/s
02:52:59 PM 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
02:52:54 PM totsck tcpsck udpsck rawsck ip-frag
02:52:59 PM 274 99 41 0 0
Average: IFACE rxpck/s txpck/s rxbyt/s txbyt/s rxcmp/s txcmp/ s rxmcst/s
Average: lo 0.20 0.20 9.99 9.99 0.00 0.00 0.00
Average: eth0 133.07 116.58 43436.76 21702.20 0.00 0.00 0.00
Average: eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: IFACE rxerr/s txerr/s coll/s rxdrop/s txdrop/s txcarr/s rxfram/s rxfifo/s txfifo/s
Average: lo 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: eth0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: eth1 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: sit0 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: call/s retrans/s read/s write/s access/s getatt/s
Average: 0.00 0.00 0.00 0.00 0.00 0.00
Average: scall/s badcall/s packet/s udp/s tcp/s hit/s miss/s sread/s swrite/s saccess/s sgetatt/s
Average: 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00 0.00
Average: totsck tcpsck udpsck rawsck ip-frag
Average: 274 99 41 0 0
sar提供四種不同的文法選項來顯示網路資訊。-n選項使用四個不同的開關:DEV、EDEV、SOCK和FULL。DEV顯示網路介面信 息,EDEV顯示關於網路錯誤的統計資料,SOCK顯示通訊端資訊,
FULL顯示所有三個開關。它們可以單獨或者一起使用。
欄位 說明
IFACE LAN介面
rxpck/s 每秒鐘接收的資料包
txpck/s 每秒鐘發送的資料包
rxbyt/s 每秒鐘接收的位元組數
txbyt/s 每秒鐘發送的位元組數
rxcmp/s 每秒鐘接收的壓縮資料包
txcmp/s 每秒鐘發送的壓縮資料包
rxmcst/s 每秒鐘接收的多播資料包
後面的只針對每一個命令做解釋,不做測試
例5: sar -r 5 5 // 記憶體和swap空間使用方式
kbmemfree:這個值和free命令中的free值基本一致,所以它不包括buffer和cache的空間.
kbmemused:這個值和free命令中的used值基本一致,所以它包括buffer和cache的空間.
%memused:這個值是kbmemused和記憶體總量(不包括swap)的一個百分比.
kbbuffers和kbcached:這兩個值就是free命令中的buffer和cache.
kbcommit:保證當前系統所需要的記憶體,即為了確保不溢出而需要的記憶體(RAM+swap).
%commit:這個值是kbcommit與記憶體總量(包括swap)的一個百分比.
例6: sar -B 5 5 // 頁交換速率
pgpgin/s:表示每秒從磁碟或SWAP置換到記憶體的位元組數(KB)
pgpgout/s:表示每秒從記憶體置換到磁碟或SWAP的位元組數(KB)
fault/s:每秒鐘系統產生的缺頁數,即主缺頁與次缺頁之和(major + minor)
majflt/s:每秒鐘產生的主缺頁數.
pgfree/s:每秒被放入空閑隊列中的頁個數
pgscank/s:每秒被kswapd掃描的頁個數
pgscand/s:每秒直接被掃描的頁個數
pgsteal/s:每秒鐘從cache中被清除來滿足記憶體需要的頁個數
%vmeff:每秒清除的頁(pgsteal)佔總掃描頁(pgscank+pgscand)的百分比
例7: sar -q 5 5 // 隊列的長度(等待啟動並執行進程數)和負載的狀態
runq-sz:處於運行或就緒的進程數量
plist-sz:現在進程的總數(包括線程).
ldavg-1:最近一分鐘的負載.
ldavg-5:最近五分鐘的負載.
ldavg-15:最近十分鐘的負載.
平均負載和隊列的資料來源於/proc/loadavg
例8: sar -n NFS 5 5 //NFS用戶端的監控
call/s:每秒成功的RPC調用都會使call/s的值增長,比如對NFS的一次讀/寫.
retrans/s:每秒重傳的RPC次數,比如因為伺服器的問題,產生timeout,這時用戶端需要重新傳輸.
read/s:每秒從NFS服務端讀取的次數.
write/s:每秒寫入到NFS服務端的次數.
access/s:每秒訪問NFS的次數,比如從NFS服務端COPY檔案.
getatt/s:每秒擷取NFS服務端檔案屬性的次數,比如ls -l /NFSSERVER/,如果NFSSERVER有300個檔案,將產生300次這樣的請求.
例9: sar -b 5 5 // IO傳送速率
tps:每秒從物理磁碟I/O的次數.多個邏輯請求會被合并為一個I/O磁碟請求,一次傳輸的大小是不確定的.
rtps:每秒的讀請求數
wtps:每秒的寫請求數
bread/s:每秒讀磁碟的資料區塊數(in blocks 1 block = 512B, 2.4以後核心)
bwrtn/s:每秒寫磁碟的資料區塊數(in blocks 1 block = 512B, 2.4以後核心)
一般情況下tps=(rtps+wtps)
sar也可以監控非即時資料,通過cron周期的運行到指定目錄下
例如:我們想查看本月27日,從0點到23點的記憶體資源.
sa27就是本月27日,指定具體的時間可以通過-s(start)和-e(end)來指定.
sar -f /var/log/sa/sa27 -s 00:00:00 -e 23:00:00 -r