一、相關概念
基本回收演算法
- 引用計數(Reference Counting)
比較古老的回收演算法。原理是此對象有一個引用,即增加一個計數,刪除一個引用則減少一個計數。記憶體回收時,只用收集計數為0的對象。此演算法最致命的是無法處理循環參考的問題。
- 標記-清除(Mark-Sweep)
此演算法執行分兩階段。第一階段從引用根節點開始標記所有被引用的對象,第二階段遍曆整個堆,把未標記的對象清除。此演算法需要暫停整個應用,同時,會產生記憶體片段。
- 複製(Copying)
此演算法把記憶體空間劃為兩個相等的地區,每次只使用其中一個地區。垃
圾回收時,遍曆當前使用地區,把正在使用中的對象複製到另外一個地區中。次演算法每次只處理正在使用中的對象,因此複製成本比較小,同時複製過去以後還能進
行相應的記憶體整理,不過出現“片段”問題。當然,此演算法的缺點也是很明顯的,就是需要兩倍記憶體空間。
- 標記-整理(Mark-Compact)
此演算法結合了“標記-清除”和“複製”兩個演算法的
優點。也是分兩階段,第一階段從根節點開始標記所有被引用對象,第二階段遍曆整個堆,把清除未標記對象並且把存活對象“壓縮”到堆的其中一塊,按順序排
放。此演算法避免了“標記-清除”的片段問題,同時也避免了“複製”演算法的空間問題。
- 增量收集(Incremental Collecting)
實施記憶體回收演算法,即:在應用進行的同時進行記憶體回收。不知道什麼原因JDK5.0中的收集器沒有使用這種演算法的。
- 分代(Generational Collecting)
基於對對象生命週期分析後得出的記憶體回收演算法。把對象分為年青代、年老代、持久代,對不同生命週期的對象使用不同的演算法(上述方式中的一個)進行回收。現在的記憶體回收行程(從J2SE1.2開始)都是使用此演算法的。
分代記憶體回收詳述
如所示,為Java堆中的各代分布。
- Young(年輕代)
年輕代分三個區。一個Eden區,兩個Survivor區。大部分對象在
Eden區中產生。當Eden區滿時,還存活的對象將被複製到Survivor區(兩個中的一個),當這個Survivor區滿時,此區的存活對象將被複
制到另外一個Survivor區,當這個Survivor去也滿了的時候,從第一個Survivor區複製過來的並且此時還存活的對象,將被複製“年老區
(Tenured)”。需要注意,Survivor的兩個區是對稱的,沒先後關係,所以同一個區中可能同時存在從Eden複製過來
對象,和從前一個Survivor複製過來的對象,而複製到年老區的只有從第一個Survivor去過來的對象。而且,Survivor區總有一個是空
的。
- Tenured(年老代)
年老代存放從年輕代存活的對象。一般來說年老代存放的都是生命期較長的對象。
- Perm(持久代)
用於存放靜態檔案,如今Java類、方法等。持久代對記憶體回收沒有顯著
影響,但是有些應用可能動態產生或者調用一些class,例如Hibernate等,在這種時候需要設定一個比較大的持久代空間來存放這些運行過程中新增
的類。持久代大小通過-XX:MaxPermSize=<N>進行設定。
GC類型
GC有兩種類型:Scavenge GC和Full GC。
- Scavenge GC
一般情況下,當新對象產生,並且在Eden申請空間失敗時,就好觸發Scavenge GC,堆Eden地區進行GC,清除非存活對象,並且把尚且存活的對象移動到Survivor區。然後整理Survivor的兩個區。
- Full GC
對整個堆進行整理,包括Young、Tenured和Perm。Full GC比Scavenge GC要慢,因此應該儘可能減少Full GC。有如下原因可能導致Full GC:
分代記憶體回收過程示範
二、記憶體回收行程
目前的收集器主要有三種:串列收集器、並行收集器、並發收集器。
- 串列收集器
使用單線程處理所有記憶體回收工作,因為無需多線程互動,所以效率比較高。但是,也無法使用多處理器的優勢,所以此收集器適合單一處理器機器。當然,此收集器也可以用在小資料量(100M左右)情況下的多處理器機器上。可以使用-XX: UseSerialGC開啟。
- 並行收集器
- 對年輕代進行並行記憶體回收,因此可以減少記憶體回收時間。一般在多線程多處理器機器上使用。使用-XX: UseParallelGC.開啟。並行收集器在J2SE5.0第六6更新上引入,在Java SE6.0中進行了增強--可以堆年老代進行並行收集。如果年老代不使用並發收集的話,是使用單線程進行記憶體回收,因此會制約擴充能力。使用-XX: UseParallelOldGC開啟。
- 使用-XX:ParallelGCThreads=<N>設定並行記憶體回收的線程數。此值可以設定與機器處理器數量相等。
- 此收集器可以進行如下配置:
- 最大記憶體回收暫停:指定記憶體回收時的最長暫停時間,通過-XX:MaxGCPauseMillis=<N>指定。<N>為毫秒.如果指定了此值的話,堆大小和記憶體回收相關參數會進行調整以達到指定值。設定此值可能會減少應用的輸送量。
- 輸送量:輸送量為記憶體回收時間與非記憶體回收時間的比值,通過-XX:GCTimeRatio=<N>來設定,公式為1/(1 N)。例如,-XX:GCTimeRatio=19時,表示5%的時間用於記憶體回收。預設情況為99,即1%的時間用於記憶體回收。
- 並發收集器
可以保證大部分工作都並發進行(應用不停止),記憶體回收只暫停很少的時間,此收集器適合對回應時間要求比較高的中、大規模應用。使用-XX: UseConcMarkSweepGC開啟。
- 並發收集器主要減少年老代的暫停時間,他在應用不停止的情況下使用獨立的記憶體回收線程,跟蹤可達對象。在每個年老代記憶體回收周期中,在收集初期並
發收集器會對整個應用進行簡短的暫停,在收集中還會再暫停一次。第二次暫停會比第一次稍長,在此過程中多個線程同時進行記憶體回收工作。
- 並發收集器使用處理器換來短暫的停頓時間。在一個N個處理器的系統上,並發收集部分使用K/N個可用處理器進行回收,一般情況下1<=K<=N/4。
- 在只有一個處理器的主機上使用並發收集器,設定為incremental mode模式也可獲得較短的停頓時間。
- 浮動垃圾:由於在應用啟動並執行同時進行記憶體回收,所以有些垃圾可能在記憶體回收進行完成時產生,這樣就造成了“Floating Garbage”,這些垃圾需要在下次記憶體回收周期時才能回收掉。所以,並發收集器一般需要20%的預留空間用於這些浮動垃圾。
- Concurrent Mode Failure:並發收集器在應用運行時進行收集,所以需要保證堆在記憶體回收的這段時間有足夠的空間供程式使用,否則,記憶體回收還未完成,堆空間先滿了。這種情況下將會發生“併發模式失敗”,此時整個應用將會暫停,進行記憶體回收。
- 啟動並發收集器:因為並發收集在應用運行時進行收集,所以必須保證收集完成之前有足夠的記憶體空間供程式使用,否則會出現“Concurrent Mode Failure”。通過設定-XX:CMSInitiatingOccupancyFraction=<N>指定還有多少剩餘堆時開始執行並發收集
- 小結
- 串列處理器:
--適用情況:資料量比較小(100M左右);單一處理器下並且對回應時間無要求的應用。
--缺點:只能用於小型應用
- 平行處理器:
--適用情況:“對輸送量有高要求”,多CPU、對應用回應時間無要求的中、大型應用。舉例:幕後處理、科學計算。
--缺點:應用回應時間可能較長
- 並發處理器:
--適用情況:“對回應時間有高要求”,多CPU、對應用回應時間有較高要求的中、大型應用。舉例:Web伺服器/應用伺服器、電信交換、整合式開發環境。
三、常見配置舉例
- 堆大小設定
JVM
中最大堆大小有三方面限制:相關作業系統的資料模型(32-bt還是64-bit)限制;系統的可用虛擬記憶體限制;系統的可用實體記憶體限制。32位系統
下,一般限制在1.5G~2G;64為作業系統對記憶體無限制。我在Windows Server 2003
系統,3.5G實體記憶體,JDK5.0下測試,最大可設定為1478m。
典型設定:
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k
-Xmx3550m:設定JVM最大可用記憶體為3550M。
-Xms3550m:設定JVM促使記憶體為3550m。此值可以設定與-Xmx相同,以避免每次記憶體回收完成後JVM重新分配記憶體。
-Xmn2g:設定年輕代大小為2G。整個堆大小=年輕代大小 年老代大小 持久代大小。持久代一般固定大小為64m,所以增大年輕代後,將會減小年老代大小。此值對系統效能影響較大,Sun官方推薦配置為整個堆的3/8。
-Xss128k:
設定每個線程的堆棧大小。JDK5.0以後每個線程堆棧大小為1M,以前每個線程堆棧大小為256K。更具應用的線程所需記憶體大小進行調整。在相同物理內
存下,減小這個值能產生更多的線程。但是作業系統對一個進程內的線程數還是有限制的,不能無限產生,經驗值在3000~5000左右。
- java -Xmx3550m -Xms3550m -Xss128k -XX:NewRatio=4 -XX:SurvivorRatio=4 -XX:MaxPermSize=16m -XX:MaxTenuringThreshold=0
-XX:NewRatio=4:設定年輕代(包括Eden和兩個Survivor區)與年老代的比值(除去持久代)。設定為4,則年輕代與年老代所佔比值為1:4,年輕代占整個堆棧的1/5
-XX:SurvivorRatio=4:設定年輕代中Eden區與Survivor區的大小比值。設定為4,則兩個Survivor區與一個Eden區的比值為2:4,一個Survivor區占整個年輕代的1/6
-XX:MaxPermSize=16m:設定持久代大小為16m。
-XX:MaxTenuringThreshold=0:設定垃圾最大年齡。如果設定為0的話,則年輕代對象不經過Survivor區,直接進入年老代。對於年老代比較多的應用,可以提高效率。如果將此值設定為一個較大值,則年輕代對象會在Survivor區進行多次複製,這樣可以增加對象再年輕代的存活時間,增加在年輕代即被回收的概論。
- 回收器選擇
JVM給了三種選擇:串列收集器、並行收集器、並發收集器,但是串列收集器只適用於小資料量的情況,所以這裡的選擇主要針對並行收集器和並發收集器。預設情況下,JDK5.0以前都是使用串列收集器,如果想使用其他收集器需要在啟動時加入相應參數。JDK5.0以後,JVM會根據當前系統配置進行判斷。
- 輸送量優先的並行收集器
如上文所述,並行收集器主要以到達一定的輸送量為目標,適用於科學技術和幕後處理等。
典型配置:
- java -Xmx3800m -Xms3800m -Xmn2g -Xss128k -XX: UseParallelGC -XX:ParallelGCThreads=20
-XX: UseParallelGC:選擇垃圾收集器為並行收集器。此配置僅對年輕代有效。即上述配置下,年輕代使用並發收集,而年老代仍舊使用串列收集。
-XX:ParallelGCThreads=20:配置並行收集器的線程數,即:同時多少個線程一起進行記憶體回收。此值最好配置與處理器數目相等。
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX: UseParallelGC -XX:ParallelGCThreads=20 -XX: UseParallelOldGC
-XX: UseParallelOldGC:配置年老代垃圾收集方式為並行收集。JDK6.0支援對年老代並行收集。
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX: UseParallelGC -XX:MaxGCPauseMillis=100
-XX:MaxGCPauseMillis=100:設定每次年輕代記憶體回收的最長時間,如果無法滿足此時間,JVM會自動調整年輕代大小,以滿足此值。
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX: UseParallelGC -XX:MaxGCPauseMillis=100 -XX: UseAdaptiveSizePolicy
-XX: UseAdaptiveSizePolicy:設定此選項後,並行收集器會自動選擇年輕代區大小和相應的Survivor區比例,以達到目標系統規定的最低相應時間或者收集頻率等,此值建議使用並行收集器時,一直開啟。
- 回應時間優先的並發收集器
如上文所述,並發收集器主要是保證系統的回應時間,減少垃圾收集時的停頓時間。適用於應用伺服器、電信領域等。
典型配置:
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX:ParallelGCThreads=20 -XX: UseConcMarkSweepGC -XX: UseParNewGC
-XX: UseConcMarkSweepGC:設定年老代為並發收集。測試中配置這個以後,-XX:NewRatio=4的配置失效了,原因不明。所以,此時年輕代大小最好用-Xmn設定。
-XX: UseParNewGC:設定年輕代為並行收集。可與CMS收集同時使用。JDK5.0以上,JVM會根據系統配置自行設定,所以無需再設定此值。
- java -Xmx3550m -Xms3550m -Xmn2g -Xss128k -XX: UseConcMarkSweepGC -XX:CMSFullGCsBeforeCompaction=5 -XX: UseCMSCompactAtFullCollection
-XX:CMSFullGCsBeforeCompaction:由於並發收集器不對記憶體空間進行壓縮、整理,所以運行一段時間以後會產生“片段”,使得運行效率降低。此值設定運行多少次GC以後對記憶體空間進行壓縮、整理。
-XX: UseCMSCompactAtFullCollection:開啟對年老代的壓縮。可能會影響效能,但是可以消除片段
- 輔助資訊
JVM提供了大量命令列參數,列印資訊,供調試使用。主要有以下一些:
- -XX: PrintGC
輸出形式:[GC 118250K->113543K(130112K), 0.0094143 secs] [Full GC 121376K->10414K(130112K), 0.0650971 secs]
- -XX: PrintGCDetails
輸出形式:[GC [DefNew: 8614K->781K(9088K), 0.0123035 secs] 118250K->113543K(130112K), 0.0124633 secs] [GC [DefNew: 8614K->8614K(9088K),
0.0000665 secs][Tenured: 112761K->10414K(121024K), 0.0433488 secs]
121376K->10414K(130112K), 0.0436268 secs]
- -XX: PrintGCTimeStamps -XX: PrintGC:PrintGCTimeStamps可與上面兩個混合使用
輸出形式:11.851: [GC 98328K->93620K(130112K), 0.0082960 secs]
- -XX: PrintGCApplicationConcurrentTime:列印每次記憶體回收前,程式未中斷的執行時間。可與上面混合使用
輸出形式:Application time: 0.5291524 seconds
- -XX: PrintGCApplicationStoppedTime:列印記憶體回收期間程式暫停時間。可與上面混合使用
輸出形式:Total time for which application threads were stopped: 0.0468229 seconds
- -XX: PrintHeapAtGC:列印GC前後的詳細堆棧資訊
輸出形式:
34.702: [GC {Heap before gc invocations=7:
def new generation total 55296K, used 52568K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 99% used [0x1ebd0000, 0x21bce430, 0x21bd0000)
from space 6144K, 55% used [0x221d0000, 0x22527e10, 0x227d0000)
to space 6144K, 0% used [0x21bd0000, 0x21bd0000, 0x221d0000)
tenured generation total 69632K, used 2696K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 3% used [0x227d0000, 0x22a720f8, 0x22a72200, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
34.735: [DefNew: 52568K->3433K(55296K), 0.0072126 secs] 55264K->6615K(124928K)Heap after gc invocations=8:
def new generation total 55296K, used 3433K [0x1ebd0000, 0x227d0000, 0x227d0000)
eden space 49152K, 0% used [0x1ebd0000, 0x1ebd0000, 0x21bd0000)
from space 6144K, 55% used [0x21bd0000, 0x21f2a5e8, 0x221d0000)
to space 6144K, 0% used [0x221d0000, 0x221d0000, 0x227d0000)
tenured generation total 69632K, used 3182K [0x227d0000, 0x26bd0000, 0x26bd0000)
the space 69632K, 4% used [0x227d0000, 0x22aeb958, 0x22aeba00, 0x26bd0000)
compacting perm gen total 8192K, used 2898K [0x26bd0000, 0x273d0000, 0x2abd0000)
the space 8192K, 35% used [0x26bd0000, 0x26ea4ba8, 0x26ea4c00, 0x273d0000)
ro space 8192K, 66% used [0x2abd0000, 0x2b12bcc0, 0x2b12be00, 0x2b3d0000)
rw space 12288K, 46% used [0x2b3d0000, 0x2b972060, 0x2b972200, 0x2bfd0000)
}
, 0.0757599 secs]
- -Xloggc:filename:與上面幾個配合使用,把相關日誌資訊記錄到檔案以便分析。
- 常見配置匯總
- 堆設定
- -Xms:初始堆大小
- -Xmx:最大堆大小
- -XX:NewSize=n:設定年輕代大小
- -XX:NewRatio=n:設定年輕代和年老代的比值。如:為3,表示年輕代與年老代比值為1:3,年輕代占整個年輕代年老代和的1/4
- -XX:SurvivorRatio=n:年輕代中Eden區與兩個Survivor區的比值。注意Survivor區有兩個。如:3,表示Eden:Survivor=3:2,一個Survivor區占整個年輕代的1/5
- -XX:MaxPermSize=n:設定持久代大小
- 收集器設定
- -XX: UseSerialGC:設定串列收集器
- -XX: UseParallelGC:設定並行收集器
- -XX: UseParalledlOldGC:設定並行年老代收集器
- -XX: UseConcMarkSweepGC:設定並發收集器
- 記憶體回收統計資訊
- -XX: PrintGC
- -XX: PrintGCDetails
- -XX: PrintGCTimeStamps
- -Xloggc:filename
- 並行收集器設定
- -XX:ParallelGCThreads=n:設定並行收集器收集時使用的CPU數。並行收集線程數。
- -XX:MaxGCPauseMillis=n:設定並行收集最大暫停時間
- -XX:GCTimeRatio=n:設定記憶體回收時間占程式已耗用時間的百分比。公式為1/(1 n)
- 並發收集器設定
- -XX: CMSIncrementalMode:設定為增量模式。適用於單CPU情況。
- -XX:ParallelGCThreads=n:設定並發收集器年輕代收集方式為並行收集時,使用的CPU數。並行收集線程數。
四、調優總結
- 年輕代大小選擇
- 回應時間優先的應用:儘可能設大,直到接近系統的最低回應時間限制(根據實際情況選擇)。在此種情況下,年輕代收集發生的頻率也是最小的。同時,減少到達年老代的對象。
- 輸送量優先的應用:儘可能的設定大,可能到達Gbit的程度。因為對回應時間沒有要求,垃圾收集可以並行進行,一般適合8CPU以上的應用。
- 年老代大小選擇
- 較小堆引起的片段問題
因為年老代的並發收集器使用標記、清除演算法,所以不會對堆進行壓縮。
當收集器回收時,他會把相鄰的空間進行合并,這樣可以分配給較大的對象。但是,當堆空間較小時,運行一段時間以後,就會出現“片段”,如果並發收集器找不
到足夠的空間,那麼並發收集器將會停止,然後使用傳統的標記、清除方式進行回收。如果出現“片段”,可能需要進行如下配置:
- -XX: UseCMSCompactAtFullCollection:使用並發收集器時,開啟對年老代的壓縮。
- -XX:CMSFullGCsBeforeCompaction=0:上面配置開啟的情況下,這裡設定多少次Full GC後,對年老代進行壓縮