Linux上設定大記憶體頁解決kswapd0進程過渡消耗cpusys的問題

最後更新：2016-07-16 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

環境：SLES11 SP4 + Oracle 11.2.0.4

新搭建測試資料庫，跑了兩天左右發現一個名為kswapd0的進程竟然佔用了1個cpu資源(該主機一共只有2個cpu)，而且幾乎都耗在cpusys上。
如所示：
圖1

網上搜尋得知kswapd0是一個核心進程，用來處理頁的交換，當OS的可用記憶體小於閥值時，kswapd會將部分進程的頁從實體記憶體交換到swap上，這個閥值如何確定，頗費周折的找尋了一番仍然沒有結果，至少在SLES 11這個版本下打消了我通過修改閥值來阻止kswapd0進程過渡活躍地消耗cpusys的解決思路。

從資料庫層面入手，首先檢查SGA是否被lock在了記憶體裡
SQL> show parameter lock_sga

NAME TYPE VALUE
------------------------------------ ---------------------- ------------------------------
lock_sga boolean TRUE
SQL>

OS層面再double check一下，確實lock住了
oracle@cspdb1:~> ipcs -m

------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x00000000 196611 oracle 640 16777216 29 locked <--確實lock住了
0x00000000 229380 oracle 640 1560281088 29 locked
0xf8e2566c 262149 oracle 640 2097152 29 locked

OS層面檢查實體記憶體尚有空閑，而真正的swap動作發生的次數並不多，不然應用早就來投訴了

圖4

圖5

從上述檢查結果我們初步可以判斷: 資料庫的SGA確被鎖定在了實體記憶體裡，kswapd0雖然辛勤勞作(佔去了一個cpu資源)但產出卻很少(被swap出來的頁很少)

該伺服器上除了oracle db外，並沒有其它應用，db上的會話數也只有幾十個，因此最大的記憶體空間還是SGA，想起之前曾經在AIX上啟用過大記憶體頁，最大的好處當然是提供更大size的連續頁塊，減少頁表在記憶體裡的佔用空間，加快頁表的搜尋速度，還有一個好處就是大記憶體頁永遠不會被swap out

為排除SGA可能會被換出實體記憶體或者至少避免kswapd0進程對SGA地區進行的無謂掃描來檢測是否有能被swap out的頁，我們按照如下步驟啟用大記憶體頁

###1、設定/etc/security/limits.conf以及設定後的檢查
* soft memlock unlimited
* hard memlock unlimited

---以oracle登入主機運行檢查上述設定是否生效
oracle@cspdb1:~> ulimit -Hl
unlimited
oracle@cspdb1:~> ulimit -Sl
unlimited

###2、確認沒有啟用AMM，因為AMM和lock_sga不相容
set linesize 100
col name format a30
col value format a30
select name,value from v$system_parameter where name in ('memory_target','memory_max_target','lock_sga');

NAME VALUE
------------------------------ ------------------------------
lock_sga TRUE
memory_target 0
memory_max_target 0

---如果AMM參數或者lock_sga設定不符合要求，可以按照如下步驟重設
SQL> alter system reset memory_max_target;

SQL> alter system reset memory_target;

SQL> alter system set lock_sga=true scope=spfile;

###3、設定大記憶體頁
---計算大記憶體頁的數量，注意執行這一步的時候必須保證執行個體至少啟動到nomount狀態
oracle@cspdb1:~> ipcs -m

------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x00000000 196611 oracle 640 16777216 29 locked
0x00000000 229380 oracle 640 1560281088 29 locked
0xf8e2566c 262149 oracle 640 2097152 29 locked

oracle@cspdb1:~> cat /proc/meminfo | grep Hugepagesize
Hugepagesize: 2048 kB

最終需要的hugepages=(16777216/2048/1024+1)+(1560281088/2048/1024+1)+(2097152/2048/1024+1)=756

---在/etc/sysctl.conf裡加入
vm.nr_hugepages=756

###4、重啟資料庫執行個體與主機，檢查大記憶體頁設定是否生效
sqlplus '/as sysdba'
shutdown immediate

init 6

cspdb1:~ # sysctl -n vm.nr_hugepages
756

oracle@cspdb1:~> grep HugePages /proc/meminfo
AnonHugePages: 45056 kB
HugePages_Total: 756
HugePages_Free: 756
HugePages_Rsvd: 0
HugePages_Surp: 0

startup

oracle@cspdb1:~> ipcs -m

------ Shared Memory Segments --------
key shmid owner perms bytes nattch status
0x00000000 196611 oracle 640 16777216 27 <---狀態從locked變為空白值了，說明大頁天生不會被swapout，所以不care lock_sga的設定:)
0x00000000 229380 oracle 640 1560281088 27
0xf8e2566c 262149 oracle 640 2097152 27

cspdb1:~ # grep HugePages /proc/meminfo
AnonHugePages: 67584 kB
HugePages_Total: 756
HugePages_Free: 623 <---Free < Total，說明已經有huge page被使用了
HugePages_Rsvd: 620
HugePages_Surp: 0

過去一周了kswapd0進程沒有再冒泡上來，詳見
圖6

以下是我對這個現象原因的猜測：當SGA以普通頁的形式存在於記憶體中的時候，雖然lock_sga=TRUE，但仍然無法阻止kswapd0進程對於sga記憶體地區的不斷掃描當然結果是不會有page會被swap out，因為lock_sga=TRUE。但這一過程中存在較多的核心級調用所以kswapd0進程會佔用大量的cpusys資源。所以徹底的方法就是啟用大記憶體頁。

本文永久更新連結地址：

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

Linux上設定大記憶體頁解決kswapd0進程過渡消耗cpusys的問題

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support