標籤:3.1 iss gre block merge express 裝置 read strong
在使用top命令的時候會看到這麼一行:
翻譯一下:us:使用者態使用的cpu時間比sy:系統態使用的cpu時間比ni:用做nice加權的進程指派的使用者態cpu時間比id:閒置cpu時間比wa:cpu等待磁碟寫入完成時間hi:硬中斷消耗時間si:非強制中斷消耗時間st:虛擬機器偷取時間如果一台機器看到wa特別高,那麼一般說明是磁碟IO出現問題,可以使用iostat等命令繼續進行詳細分析。
1, 安裝 iostat
yum install sysstat
之後就可以使用 iostat 命令了,
2,入門使用
iostat -d -k 2
參數 -d 表示,顯示裝置(磁碟)使用狀態;-k某些使用block為單位的列強制使用Kilobytes為單位;2表示,資料顯示每隔2秒重新整理一次。
tps:該裝置每秒的傳輸次數(Indicate the number of transfers per second that were issued to the device.)。"一次傳輸"意思是"一次I/O請求"。多個邏輯請求可能會被合并為"一次I/O請求"。"一次傳輸"請求的大小是未知的。kB_read/s:每秒從裝置(drive expressed)讀取的資料量;
kB_wrtn/s:每秒向裝置(drive expressed)寫入的資料量;
kB_read:讀取的總資料量;kB_wrtn:寫入的總數量資料量;這些單位都為Kilobytes。
指定監控的裝置名稱為sda,該命令的輸出結果和上面命令完全相同。
iostat -d sda 2
預設監控所有的硬碟裝置,現在指定只監控sda。
3, -x 參數
iostat還有一個比較常用的選項-x,該選項將用於顯示和io相關的擴充資料。
iostat -d -x -k 1 10
輸出資訊的含義
rrqm/s:每秒這個裝置相關的讀取請求有多少被Merge了(當系統調用需要讀取資料的時候,VFS將請求發到各個FS,如果FS發現不同的讀取請求讀取的是相同Block的資料,
FS會將這個請求合并Merge);
wrqm/s:每秒這個裝置相關的寫入請求有多少被Merge了。rsec/s:每秒讀取的扇區數;wsec/:每秒寫入的扇區數。rKB/s:The number of read requests that were issued to the device per second;wKB/s:The number of write requests that were issued to the device per second;avgrq-sz 平均請求扇區的大小avgqu-sz 是平均請求隊列的長度。毫無疑問,隊列長度越短越好。 await: 每一個IO請求的處理的平均時間(單位是微秒毫秒)。這裡可以理解為IO的回應時間,一般地系統IO回應時間應該低於5ms,如果大於10ms就比較大了。 這個時間包括了隊列時間和服務時間,也就是說,一般情況下,await大於svctm,它們的差值越小,則說明隊列時間越短,反之差值越大,隊列時間越長,說明系統出了問題。svctm 表示平均每次裝置I/O操作的服務時間(以毫秒為單位)。如果svctm的值與await很接近,表示幾乎沒有I/O等待,磁碟效能很好,如果await的值遠高於svctm的值,
則表示I/O隊列等待太長,
系統上啟動並執行應用程式將變慢。
%util: 在統計時間內所有處理IO時間,除以總共統計時間。例如,如果統計間隔1秒,該裝置有0.8秒在處理IO,
而0.2秒閑置,那麼該裝置的%util = 0.8/1 = 80%,
所以該參數暗示了裝置的繁忙程度
。一般地,如果該參數是100%表示裝置已經接近滿負荷運行了
(當然如果是多磁碟,即使%util是100%,因為磁碟的並發能力,所以磁碟使用未必就到了瓶頸)。
4, 常見用法
iostat -d -k 1 10 #查看TPS和輸送量資訊(磁碟讀寫速度單位為KB)iostat -d -m 2 #查看TPS和輸送量資訊(磁碟讀寫速度單位為MB)iostat -d -x -k 1 10 #查看裝置使用率(%util)、回應時間(await) iostat -c 1 10 #查看cpu狀態
5, 執行個體分析
iostat -d -k 1 | grep vdaDevice: tps kB_read/s kB_wrtn/s kB_read kB_wrtnsda10 60.72 18.95 71.53 395637647 1493241908sda10 299.02 4266.67 129.41 4352 132sda10 483.84 4589.90 4117.17 4544 4076sda10 218.00 3360.00 100.00 3360 100sda10 546.00 8784.00 124.00 8784 124sda10 827.00 13232.00 136.00 13232 136
上面看到,磁碟每秒傳輸次數平均約400;每秒磁碟讀取約5MB,寫入約1MB。
iostat -d -x -k 1Device: rrqm/s wrqm/s r/s w/s rsec/s wsec/s rkB/s wkB/s avgrq-sz avgqu-sz await svctm %utilsda 1.56 28.31 7.84 31.50 43.65 3.16 21.82 1.58 1.19 0.03 0.80 2.61 10.29sda 1.98 24.75 419.80 6.93 13465.35 253.47 6732.67 126.73 32.15 2.00 4.70 2.00 85.25sda 3.06 41.84 444.90 54.08 14204.08 2048.98 7102.04 1024.49 32.57 2.10 4.21 1.85 92.24
可以看到磁碟的平均回應時間<5ms,磁碟使用率>80。磁碟響應正常,但是已經很繁忙了。
可以看到磁碟的平均回應時間<5ms,磁碟使用率>90。磁碟響應正常,但是已經很繁忙了。
await: 每一個IO請求的處理的平均時間(單位是微秒毫秒)。這裡可以理解為IO的回應時間,一般地系統IO回應時間應該低於5ms,如果大於10ms就比較大了
svctm 表示平均每次裝置I/O操作的服務時間(以毫秒為單位)。如果svctm的值與await很接近,表示幾乎沒有I/O等待,磁碟效能很好,
如果await的值遠高於svctm的值,則表示I/O隊列等待太長, 系統上啟動並執行應用程式將變慢。
%util: 在統計時間內所有處理IO時間,除以總共統計時間
所以該參數暗示了裝置的繁忙程度
。一般地,如果該參數是100%表示裝置已經接近滿負荷運行了(當然如果是多磁碟,即使%util是100%,因為磁碟的並發能力,所以磁碟使用未必就到了瓶頸)。
也可以使用下面的命令,同時顯示cpu和磁碟的使用方式
linux wa%過高,iostat查看io狀況