英文原文:Maoni Stephens,編譯:趙玉開(@玉開Sir)
CLR記憶體回收行程根據所佔空間大小劃分對象。大對象和小對象的處理方式有很大區別。比如記憶體磁碟重組 —— 在記憶體中移動大對象的成本是昂貴的,讓我們研究一下記憶體回收行程是如何處理大對象的,大對象對程式效能有哪些潛在的影響。
大對象堆和記憶體回收
在.Net 1.0和2.0中,如果一個對象的大小超過85000byte,就認為這是一個大對象。這個數字是根據效能最佳化的經驗得到的。當一個對象申請記憶體大小達到這個閾值,它就會被分配到大對象堆上。這意味著什麼呢?要理解這個,我們需要理解.Net記憶體回收機制。
如大多人所知道的,.Net GC是按照“代”來回收的。程式中的對象共有3代,0代、1代和2代,0代是最年輕的對象,2代對象存活的時間最長。GC按代回收垃圾也是出於效能考慮的;通常的對象都會在0代是被回收。例如,在一個asp.net程式中,和每一個請求相關的對象都應該在請求結束時回收掉。而沒有被回收的對象會成為1代對象;也就是說1代對象是常駐記憶體對象和馬上消亡對象之間的一個緩衝區。
從代的角度看,大對象屬於2代對象,因為只有在2代回收時才會處理大對象。當某代記憶體回收執行時,會同時執行更年輕代的記憶體回收。比如:當1代記憶體回收時會同時回收1代和0代的對象,當2代記憶體回收時會執行1代和0代的回收.
代是記憶體回收行程區分記憶體地區的邏輯視圖。從實體儲存體角度看,對象分配在不同的託管堆上。一個託管堆(managed heap)是記憶體回收行程從作業系統申請的記憶體區(通過調用windows api VirtualAlloc)。當CLR載入記憶體之後,會初始化兩個託管堆,一個大對象堆(LOH –large object heap)和一個小對象對(SOH – small object heap)。
記憶體配置請求就是將託管對象放到對應的託管堆上。如果對象的大小小於85000byte,它會被放置在SOH;否則會被放在LOH上。
對於SOH,對象在執行一次記憶體回收之後,會進入到下一代。也就是說如果在第一次執行記憶體回收時,存活下來的對象會進入第二代,如果在第2次記憶體回收之後該對象仍然沒有被當作記憶體回收掉,它就會成為2代對象;2代對象就是最老的對象不會在提升代數。
當觸發記憶體回收時,記憶體回收行程會在小對象堆做磁碟重組,將存活下來的對象移動到一起。而對於大對象堆,由於移動記憶體的開銷很大,CLR團隊選擇只是清除它們,將回收掉的對象組成一個列表,以便滿足下次有大對象申請使用記憶體,相鄰的垃圾對象會被合并成一塊閒置記憶體塊。
需要時時留意的是,直到.Net 4.0中也不會對大對象堆做磁碟重組操作,將來也許會做。因此如果你要分配大對象並不想他們被移動,你可以使用fixed語句。
如下小對象堆SOH的回收
中第一次記憶體回收之前有四個對象obj0-3;在第一記憶體回收之後obj1和obj3被回收了,同時obj2和obj0移動到一起了;在第二次記憶體回收之前有分配了三個對象obj4-6;在第二次執行記憶體回收之後obj2和obj5被回收了,obj4和obj6被移動到obj0旁邊。
是大對象堆LOH回收
可以看到在未執行記憶體回收之前,一共有四個對象obj0-3;第一次二代記憶體回收之後obj1和obj2被回收掉了,回收掉之後obj1和obj2所佔空間被合并到了一起,在obj4申請分配記憶體時就把obj1和obj2回收後釋放的空間分配給它了;同時留下了一塊記憶體片段。如果這個片段的大小小於85000byte,那麼這個片段就在這個程式的生命週期中永遠不能被再次利用了。
如果大對象堆上沒有足夠的空閑記憶體容納要申請的大對象空間,CLR首先會嘗試向作業系統申請記憶體,如果申請失敗,就會觸發一次二代回收來嘗試釋放一些記憶體。
在2代記憶體回收時,可以將不需要的記憶體通過VirtualFree交還給作業系統。交還的過程參見:
什麼時候回收大對象呢?
在討論什麼時候回收大對象之前先來看下普通的記憶體回收操作什麼時機執行吧。記憶體回收在下列情況下發生:
1. 申請的空間超過0代記憶體大小或者大對象堆的閾值,多數的託管堆記憶體回收在這種情況下發生
2. 在程式碼中調用GC.Collect方法時;如果在調用GC.Collect方法是傳入GC.MaxGeneration參數時,會執行所有代對象的記憶體回收,包括大對象堆的記憶體回收
3. 作業系統記憶體不足時,當應用程式收到作業系統發出的高記憶體通知時
4. 如果記憶體回收演算法認為做二代回收是有收效時會觸發二代記憶體回收
5. 每一代對象堆的都有一個所佔空間大小閾值的屬性,當你指派至到某一代,你增長了記憶體總量接近了該代的閾值,或者指派至導致這一代的堆大小超過了堆閾值,就會發生一次記憶體回收。因此當你分配小對象或者大對象時,會對應消耗0代堆或者大對象堆的閾值。當記憶體回收行程將對象代數提升到1代或者2代時,會消耗1、2代的閾值。在程式運行中這些閾值是動態變化的。
大對象堆效能影響
讓我們先看下分配大對象的代價。 CLR為每個新對象分配記憶體時都要保證這些記憶體清空的,是沒有被其他對象使用的(I give out is cleared)。這就意味著分配的代價完全被清理(clearing)的代價控制著(除非在分配時觸發了一次記憶體回收)。如果清空1byte需要2個周期(cycles),就意味著清除一個最小的大對象需要170,000個周期。通常情況下人們不會分配超大的對象,比如說在2GHz的機器上分配16M大小的對象,大約需要16ms來清空記憶體。這代價太大了。
讓我們在看下回收的代價。前面提到過,大對象和2代齡對象一起回收。如果大對象或者2代對象佔用空間超過其閾值時,就會觸發2代對象的回收。如果2代回收因為大對象堆超過閾值被觸發,2代對象堆本身沒有多少對象可以做回收。如果在2代堆上沒有多少對象,這問題不大。但是如果2代堆很大對象很多,過多的2代回收就會導致效能問題。如果是臨時性的分配大對象,就需要很多的時間來運行記憶體回收;也就是說如果你持續的使用大對象然後又釋放大對象對效能會有很大的負面影響。
大對象堆上的巨大對象通常是數組(很少有一個對象很大的情況)。如果對象中的元素是強引用,代價會很高;如果元素之間沒有相互引用,記憶體回收時就不需要遍曆整個數組。例如:用一個數組來儲存二叉樹的節點,一種方法是在節點中強引用左右節點:
class Node{Data d;Node left;Node right;} Node[] binaryTree = new Node[num_nodes];
如果num_nodes是一個很大的數字,就意味著每個節點都至少需要查看二個引用元素。一種替代方案是在節點中儲存左右節點元素的數組索引號
class Node{Data d;uint left_index;uint right_index;}
這樣的話,元素之間的參考關聯性去掉了;可以通過binaryTree[left_index]來獲得引用的節點。記憶體回收行程在做記憶體回收時也不需要看相關的引用元素了。
為大對象堆收集效能資料
有幾種方法可以收集大對象堆相關的效能資料。在我解釋這些方法之前,讓我們先談一下為什麼需要收集大對象堆相關的效能資料。
在你開始上搜集某個方面的效能資料時,有可能你已經找到這方面造成效能瓶頸的證據;或者你已經沒有找遍了所有方面都沒有發現問題。
在尋找效能問題時.Net CLR Memory 效能計數器通常是應該先考慮使用的工具。和LOH相關的計數器有generation 2 collectioins(2代堆收集次數)和large object heap size大對象堆大小。Generation 2 collections顯示的是進程啟動之後2代記憶體回收操作發生的次數。Large object heap size計數器顯示的是當前大對象堆的大小值,包括空閑空間;這個計數器是在每次記憶體回收操作之後做更新,並非每次分配記憶體都做更新。
可以參考在windows效能計數器中觀察.Net CLR Memory相關效能資料
你也可以通過程式查詢這些計數器的值;很多人通過程式的方式收集效能計數器來協助尋找效能瓶頸。
當然也可以使用調試器winddbg觀察大對象堆。
最後提示一下:到目前為止,大對象堆作為記憶體回收的一部分是不做記憶體磁碟重組的,但是這個只是一個clr的實現細節,程式碼不應該依賴這個特點。如果要確保對象不會被記憶體回收行程移動,就要使用fixed語句。
原文地址:http://www.php.cn/
以上就是.Net 記憶體回收和大對象處理的內容,更多相關內容請關注topic.alibabacloud.com(www.php.cn)!