linux下proc裡關於磁碟效能的參數
說明:整理轉載
轉載地址:http://blog.chinaunix.net/uid-20321915-id-1966431.html
我們在磁碟寫操作持續繁忙的伺服器上曾經碰到一個特殊的效能問題。每隔 30 秒,伺服器就會遇到磁碟寫活動高峰,導致請求處理延遲非常大(超過3秒)。後來上網查了一下資料,通過調整核心參數,將寫活動的高峰分布成頻繁的多次寫, 每次寫入的資料比較少。這樣可以把尖峰的寫操作削平成多次寫操作。以這種方式執行的效率比較低,因為核心不太有機會組合寫操作。但對於繁忙的伺服器,寫操 作將更一致地進行,並將極大地改進互動式效能。
下面是相關參數的調整:
一、2.6核心下
1、/proc/sys/vm/dirty_ratio
這個參數控制檔案系統的檔案系統寫緩衝區的大小,單位是百分比,表示系統記憶體的百分比,表示當寫緩衝使用到系統記憶體多少的時候,開始向磁碟寫出資料。增大
之會使用更多系統記憶體用於磁碟寫緩衝,也可以極大提高系統的寫效能。但是,當你需要持續、恒定的寫入場合時,應該降低其數值,:
echo '1' > /proc/sys/vm/dirty_ratio
2、/proc/sys/vm/dirty_background_ratio
這個參數控制檔案系統的pdflush進程,在何時重新整理磁碟。單位是百分比,表示系統記憶體的百分比,意思是當寫緩衝使用到系統記憶體多少的時
候,pdflush開始向磁碟寫出資料。增大之會使用更多系統記憶體用於磁碟寫緩衝,也可以極大提高系統的寫效能。但是,當你需要持續、恒定的寫入場合時,
應該降低其數值,:
echo '1' > /proc/sys/vm/dirty_background_ratio
3、/proc/sys/vm/dirty_writeback_centisecs
這個參數控制核心的髒資料重新整理進程pdflush的運行間隔。單位是 1/100 秒。預設數值是500,也就是 5 秒。如果你的系統是持續地寫入動作,那麼實際上還是降低這個數值比較好,這樣可以把尖峰的寫操作削平成多次寫操作。設定方法如下:
echo "100" > /proc/sys/vm/dirty_writeback_centisecs 如果你的系統是短期地尖峰式的寫操作,並且寫入資料不大(幾十M/次)且記憶體有比較多富裕,那麼應該增大此數值:
echo "1000" > /proc/sys/vm/dirty_writeback_centisecs
4、/proc/sys/vm/dirty_expire_centisecs
這個參數聲明Linux核心寫緩衝區裡面的資料多“舊”了之後,pdflush進程就開始考慮寫到磁碟中去。單位是 1/100秒。預設是
30000,也就是 30
秒的資料就算舊了,將會重新整理磁碟。對於特別重載的寫操作來說,這個值適當縮小也是好的,但也不能縮小太多,因為縮小太多也會導致IO提高太快。
echo "100" > /proc/sys/vm/dirty_expire_centisecs
當然,如果你的系統記憶體比較大,並且寫入模式是間歇式的,並且每次寫入的資料不大(比如幾十M),那麼這個值還是大些的好。
5、/proc/sys/vm/vfs_cache_pressure
該檔案表示核心回收用於directory和inode
cache記憶體的傾向;預設值100表示核心將根據pagecache和swapcache,把directory和inode
cache保持在一個合理的百分比;降低該值低於100,將導致核心傾向於保留directory和inode
cache;增加該值超過100,將導致核心傾向於回收directory和inode cache
預設設定:100
6、/proc/sys/vm/min_free_kbytes
該檔案表示強制Linux VM最低保留多少空閑記憶體(Kbytes)。 預設設定:724(512M實體記憶體)
7、/proc/sys/vm/nr_pdflush_threads
該檔案表示當前正在啟動並執行pdflush進程數量,在I/O負載高的情況下,核心會自動增加更多的pdflush進程。
預設設定:2(唯讀)
8、/proc/sys/vm/overcommit_memory
該檔案指定了核心針對記憶體配置的策略,其值可以是0、1、2。
0, 表示核心將檢查是否有足夠的可用記憶體供應用進程使用;如果有足夠的可用記憶體,記憶體申請允許;否則,記憶體申請失敗,並把錯誤返回給應用進程。
1, 表示核心允許分配所有的實體記憶體,而不管當前的記憶體狀態如何。
2, 表示核心允許分配超過所有實體記憶體和交換空間總和的記憶體(參照overcommit_ratio)。
預設設定:0
9、/proc/sys/vm/overcommit_ratio
該檔案表示,如果overcommit_memory=2,可以過載記憶體的百分比,通過以下公式來計算系統整體可用記憶體。
系統可分配記憶體=交換空間+實體記憶體*overcommit_ratio/100 預設設定:50(%)
10、/proc/sys/vm/page-cluster
該檔案表示在寫一次到swap區的時候寫入的頁面數量,0表示1頁,1表示2頁,2表示4頁。 預設設定:3(2的3次方,8頁)
11、/proc/sys/vm/swapiness
該檔案表示系統進行交換行為的程度,數值(0-100)越高,越可能發生磁碟交換。
二、2.4核心下
通過修改檔案/proc/sys/vm/bdflush實現。檔案中的九個參數含義如下:
nfract:dirty緩衝在緩衝區中的最大百分比。超過這個值將bdflush進程重新整理硬碟。當可用記憶體比較少的情況下,將引發大量的磁碟I/O。為了均衡磁碟I/O,可以保持一個比較低的值。
Ndirty:bdflush進程一次寫入磁碟的最大dirty緩衝塊數量。這個值比較大將導致I/O急劇增加,如果這個比較小,bdflush進程執行不夠從而可能導致記憶體的瓶頸。
Dummy2 :未使用
Dummy3:未使用
Interval:kupdated工作和重新整理的最小頻率,預設值是5秒。最小值是0秒最大值是600秒。
Age_buffer:緩衝資料寫到磁碟之前作業系統等待的最大時間。預設值是30秒,最小值是1秒最大值是6000秒。
Nfract_sync:dirty緩衝啟用bdflush進程同步的百分比。預設值是60%。
Nfract_stop:dirty緩衝停止bdflush進程的百分比。預設值是20%。
Dummy5:未使用
比如在一個寫操作頻繁的資料庫伺服器上設定:
10 500 0 0 50 30 10 0 0
------------------------華---麗---的---分---割---線------------------------
網上有很多都在問如何限制 cache 的大小,找了一輪都沒有找到答案,其中一個方法就是修改 /proc/sys/vm/min_free_kbytes 這個檔案,把它的值設定大一點,cache 就相應的受到限制,但是把這個值調大後會不會對系統有其它影響,暫時未知。歡迎大牛們提供點意見,謝謝!