介紹
低層次的語言,如C,具有低層級的記憶體管理命令,如:malloc()和free(),需要開發人員手工釋放記憶體。然而像javascript這樣的進階語言情況則不同,對象(objects, strings 等)建立的時候分配記憶體,當他們不在使用的時候記憶體會被自動回收,這個自動回收的過程被稱為記憶體回收。因為記憶體回收的存在,讓javascript等進階語言開發人員產生了一個錯誤的認識,以為可以不用關心記憶體管理。
記憶體生命週期
不管什麼樣的程式設計語言,記憶體的生命週期基本上是一致的。
1.分配你需要的記憶體
2.使用他進行讀寫操作
3.當記憶體不需要的時候,釋放資源
步驟1和步驟2對於所有語言都一樣,能明顯覺察到。至於步驟3,低層級語言需要開發人員顯式執行。而對於像javascript這樣的進階語言,這部分操作是交給解析器完成的,所以你不會覺察到。
javascript中的分配操作
值的初始化
在為變數賦值的時候,javascript會完成記憶體的分配工作。
複製代碼 代碼如下:
var n = 123; // 為數字分配記憶體
var s = "azerty"; // 為字串分配記憶體
var o = {
a: 1,
b: null
}; // 為包含屬性值的object對象分配記憶體
var a = [1, null, "abra"]; // 為包含值的數組分配記憶體
function f(a){
return a + 2;
} // 為函數分配記憶體(函數是可調用的對象)
// 函數運算式同樣也是對象,存在分配記憶體的情況
someElement.addEventListener('click', function(){
someElement.style.backgroundColor = 'blue';
}, false);
通過函數調用完成分配
一些函數當執行完畢之後,同樣存在對象分配的情況發生。
複製代碼 代碼如下:
var d = new Date();
var e = document.createElement('div'); // 分配一個 DOM 元素
一些方法會分配新值或者對象。
複製代碼 代碼如下:
var s = "azerty";
var s2 = s.substr(0, 3); // s2 是一個新的字串
// 由於字串是不變的,javascript會為[0, 3]範圍的內容建立一個新的字串
var a = ["ouais ouais", "nan nan"];
var a2 = ["generation", "nan nan"];
var a3 = a.concat(a2); // 把 a 和 a2 結合在一起,產生一個新的數組
對值的使用
對值的使用,其實也就是對分配後的記憶體執行讀寫操作。這些操作包括:對變數或者對象的屬性進行讀寫操作,或者向函數傳遞參數。
當不再需要的時候,釋放記憶體
絕大多數記憶體管理的問題都發生在這個階段。最難做的事情是,如何判定分配的記憶體不再需要。這往往需要開發人員做出判定,程式在什麼時候不再需要記憶體,並釋放他所佔資源。
進階語言的解析器中嵌入了一個叫做“垃圾收集器”的程式,他的工作是用來跟蹤記憶體的分配和使用,判定記憶體是否被需要,在不再需要的時候執行資源釋放操作。他只能獲得一個近似值,因為判斷一個記憶體是否被需要,這是個不確定的問題(不能通過一種演算法解決)。
記憶體回收
正如上文所述,我們無法準確的做到自動判定“記憶體不再需要”。所以,記憶體回收對該問題的解決方案有局限性。本節將解釋必要的概念,瞭解主要的垃圾收集演算法和它們的局限性。
引用
記憶體回收中一個主要的概念是引用。在記憶體管理中,當一個對象無論是顯式的還是隱式的使用了另外一個對象,我們就說他引用了另外一個對象。例如,javascript對象存在一個隱式的指向原型的引用,還有顯式指向他的屬性值的引用。
在這裡,對象的概念超出了javascript傳統意義上對象的概念,他還包括函數範圍和全域範圍。
使用引用計數演算法的記憶體回收
下面要介紹的是一種最理想化的演算法,引入了 “對象不再需要” 和 “沒有其他對象引用該對象” 的概念。當該對象的引用指標變為0的時候,就認為他可以被回收。
例子:
複製代碼 代碼如下:
var o = {
a: {
b:2
}
}; // 建立了兩個對象. 一個對象(a)被另外一個對象(o引用的對象)引用,並把a作為他的屬性
// 該對象又被變數o引用
// 很明顯,這時沒有對象能被回收
var o2 = o; // 變數 o2 再次引用了該對象
o = 1; // o 不再引用該對象,只有o2還在引用該對象
var oa = o2.a; // oa引用 o2 的屬性對象 a
// 該對象被其他兩個對象引用,分別是o2的屬性a和oa變數
o2 = "yo"; // 該對象已經不再被其他對象引用了,但是他的屬性a任然被oa變數引用,所以他還不能被釋放
oa = null; // 現在屬性a也不再被別的對象引用,該對象可以被回收了
限制:迴圈
該演算法有其局限性,當一個對象引用另外一個對象,當形成循環參考時,即時他們不再被需要了,垃圾收集器也不會回收他們。
複製代碼 代碼如下:
function f(){
var o = {};
var o2 = {};
o.a = o2; // o 引用 o2
o2.a = o; // o2 引用 o
return "azerty";
}
f();
// 兩個對象被建立,並形成相互引用
// 函數調用結束之後,他們不會脫離函數範圍,雖然他們不會被使用,但不會被釋放
// 這是因為,引用計數的演算法判定只要對象存在被引用的情況,那麼就不能對其執行記憶體回收
現實中的例子
ie6、7中,在dom對象上使用引用計數的演算法,這裡會存在記憶體泄露的問題。
複製代碼 代碼如下:
var div = document.createElement("div");
div.onclick = function(){
doSomething();
}; // div 通過 click 屬性引用了事件處理常式
// 當事件處理函數中訪問了div變數的時候,會形成循環參考,將導致兩個對象都不會被回收,造成記憶體泄露
標記 - 清除演算法
他引入了“對象不再需要”和“對象不可訪問(對象不可達)”的概念。該演算法假設有一系列的根對象(javascript中的根對象就是全域對象),每隔一段時間,垃圾收集器就會從根對象開始,遍曆所以他引用的對象,然後再遍曆引用對象引用的對象,以此類推。使用這種方式,垃圾收集器可以獲得所有可訪問的對象,回收那些不可訪問的對象。
這種演算法比之前的演算法好些,0引用的對象會被設定為不可訪問對象,同時他也避免了循環參考造成的困惱。
截止2012年,大多數現代瀏覽器使用的是這種“標記-清除演算法”的記憶體回收行程。JavaScript垃圾收集領域(代/增量/並發/並行的垃圾收集),在過去的幾年改善了與之相關的演算法,但是垃圾收集演算法本身(標記-清除演算法)和“如何判定一個對象不再需要”並沒有得以改善。
周期不再是一個問題
在第一個例子中,函數調用結束之後,這兩個對象不會被全域對象引用,也不會被全域對象引用的對象引用。因此,他們會被javascript記憶體回收行程標記為不可訪問對象。這種事情同樣也發生在第二個例子中,當div和事件處理函數被記憶體回收行程標記為不可訪問,他們就會被釋放掉。
限制:對象需要明確的標記為不可訪問
這種標記的方法存在局限,但是我們在編程中被沒有接觸到他,所以我們很少關心記憶體回收相關的內容。