標籤:ice 說明 佔用 多個 second 最佳化 顯示 last 版本
iostat是I/O statistics(輸入/輸出統計)的縮寫,用來動態監視系統的磁碟操作活動
iostat[參數][時間][次數]
通過iostat方便查看CPU、網卡、tty裝置、磁碟、CD-ROM 等等裝置的活動情況, 負載資訊
- -C 顯示CPU使用方式
- -d 顯示磁碟使用方式
- -k 以 KB 為單位顯示
- -m 以 M 為單位顯示
- -N 顯示磁碟陣列(LVM) 資訊
- -n 顯示NFS 使用方式
- -p[磁碟] 顯示磁碟和分區的情況
- -t 顯示終端和CPU的資訊
- -x 顯示詳細資料
- -V 顯示版本資訊
執行個體1:顯示所有裝置負載情況 iostat
-
cpu屬性值說明:
-
- %user:CPU處在使用者模式下的時間百分比。
- %nice:CPU處在帶NICE值的使用者模式下的時間百分比。
- %system:CPU處在系統模式下的時間百分比。
- %iowait:CPU等待輸入輸出完成時間的百分比。
- %steal:管理程式維護另一個虛擬處理器時,虛擬CPU的無意識等待時間百分比。
- %idle:CPU空閑時間百分比。
註:如果%iowait的值過高,表示硬碟存在I/O瓶頸,%idle值高,表示CPU較空閑,如果%idle值高但系統響應慢時,有可能是CPU等待分配記憶體,此時應加大記憶體容量。%idle值如果持續低於10,那麼系統的CPU處理能力相對較低,表明系統中最需要解決的資源是CPU。
-
disk屬性值說明:
-
- rrqm/s: 每秒進行 merge 的讀運算元目。即 rmerge/s
- wrqm/s: 每秒進行 merge 的寫運算元目。即 wmerge/s
- r/s: 每秒完成的讀 I/O 裝置次數。即 rio/s
- w/s: 每秒完成的寫 I/O 裝置次數。即 wio/s
- rsec/s: 每秒讀扇區數。即 rsect/s
- wsec/s: 每秒寫扇區數。即 wsect/s
- rkB/s: 每秒讀K位元組數。是 rsect/s 的一半,因為每扇區大小為512位元組。
- wkB/s: 每秒寫K位元組數。是 wsect/s 的一半。
- avgrq-sz: 平均每次裝置I/O操作的資料大小 (扇區)。
- avgqu-sz: 平均I/O隊列長度。
- await: 平均每次裝置I/O操作的等待時間 (毫秒)。
- svctm: 平均每次裝置I/O操作的服務時間 (毫秒)。
- %util: 一秒中有百分之多少的時間用於 I/O 操作,即被io消耗的cpu百分比
備忘:如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁碟可能存在瓶頸。如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;如果 await 遠大於 svctm,說明I/O 隊列太長,io響應太慢,則需要進行必要最佳化。如果avgqu-sz比較大,也表示有當量io在等待。
執行個體2:定時顯示所有資訊
iostat 2 3 說明:每隔 2秒重新整理顯示,且顯示3次
執行個體3:查看TPS和輸送量
iostat -d -k 1 1
- tps:該裝置每秒的傳輸次數(Indicate the number of transfers per second that were issued to the device.)。“一次傳輸”意思是“一次I/O請求”。多個邏輯請求可能會被合并為“一次I/O請求”。“一次傳輸”請求的大小是未知的。
- kB_read/s:每秒從裝置(drive expressed)讀取的資料量;
- kB_wrtn/s:每秒向裝置(drive expressed)寫入的資料量;
- kB_read:讀取的總資料量;kB_wrtn:寫入的總數量資料量;
這些單位都為Kilobytes。
上面的例子中,我們可以看到磁碟sda以及它的各個分區的統計資料,當時統計的磁碟總TPS是1.95,下面是各個分區的TPS。(因為是瞬間值,所以總TPS並不嚴格等於各個分區TPS的總和)
執行個體4:查看裝置使用率(%util)和回應時間(await)
iostat -d -x -k 1 1
- rrqm/s: 每秒進行 merge 的讀運算元目.即 delta(rmerge)/s
- wrqm/s: 每秒進行 merge 的寫運算元目.即 delta(wmerge)/s
- r/s: 每秒完成的讀 I/O 裝置次數.即 delta(rio)/s
- w/s: 每秒完成的寫 I/O 裝置次數.即 delta(wio)/s
- rsec/s: 每秒讀扇區數.即 delta(rsect)/s
- wsec/s: 每秒寫扇區數.即 delta(wsect)/s
- rkB/s: 每秒讀K位元組數.是 rsect/s 的一半,因為每扇區大小為512位元組.(需要計算)
- wkB/s: 每秒寫K位元組數.是 wsect/s 的一半.(需要計算)
- avgrq-sz:平均每次裝置I/O操作的資料大小 (扇區).delta(rsect+wsect)/delta(rio+wio)
- avgqu-sz:平均I/O隊列長度.即 delta(aveq)/s/1000 (因為aveq的單位為毫秒).
- await: 平均每次裝置I/O操作的等待時間 (毫秒).即 delta(ruse+wuse)/delta(rio+wio)
- svctm: 平均每次裝置I/O操作的服務時間 (毫秒).即 delta(use)/delta(rio+wio)
- %util: 一秒中有百分之多少的時間用於 I/O 操作,或者說一秒中有多少時間 I/O 隊列是非空的,即 delta(use)/s/1000 (因為use的單位為毫秒)
如果 %util 接近 100%,說明產生的I/O請求太多,I/O系統已經滿負荷,該磁碟可能存在瓶頸。 idle小於70% IO壓力就較大了,一般讀取速度有較多的wait。 同時可以結合vmstat 查看查看b參數(等待資源的進程數)和wa參數(IO等待所佔用的CPU時間的百分比,高過30%時IO壓力高)。
另外 await 的參數也要多和 svctm 來參考。差的過高就一定有 IO 的問題。
avgqu-sz 也是個做 IO 調優時需要注意的地方,這個就是直接每次操作的資料的大小,如果次數多,但資料拿的小的話,其實 IO 也會很小。如果資料拿的大,才IO 的資料會高。也可以通過 avgqu-sz × ( r/s or w/s ) = rsec/s or wsec/s。也就是講,讀定速度是這個來決定的。
svctm 一般要小於 await (因為同時等待的請求的等待時間被重複計算了),svctm 的大小一般和磁碟效能有關,CPU/記憶體的負荷也會對其有影響,請求過多也會間接導致 svctm 的增加。await 的大小一般取決於服務時間(svctm) 以及 I/O 隊列的長度和 I/O 請求的發出模式。如果 svctm 比較接近 await,說明 I/O 幾乎沒有等待時間;如果 await 遠大於 svctm,說明 I/O 隊列太長,應用得到的回應時間變慢,如果回應時間超過了使用者可以容許的範圍,這時可以考慮更換更快的磁碟,調整核心 elevator 演算法,最佳化應用,或者升級 CPU。
隊列長度(avgqu-sz)也可作為衡量系統 I/O 負荷的指標,但由於 avgqu-sz 是按照單位時間的平均值,所以不能反映瞬間的 I/O 洪水。
-
形象的比喻:
-
- r/s+w/s 類似於交款人的總數
- 平均隊列長度(avgqu-sz)類似於單位時間裡平均排隊人的個數
- 平均服務時間(svctm)類似於收銀員的收款速度
- 平均等待時間(await)類似於平均每人的等待時間
- 平均I/O資料(avgrq-sz)類似於平均每人所買的東西多少
- I/O 操作率 (%util)類似於收款台前有人排隊的時間比例
裝置IO操作:總IO(io)/s = r/s(讀) +w/s(寫)
平均等待時間=單個I/O伺服器時間*(1+2+...+請求總數-1)/請求總數
每秒發出的I/0請求很多,但是平均隊列就4,表示這些請求比較均勻,大部分處理還是比較及時。
iostat 監視I/O子系統