標籤:style class blog code color 使用
摘要:當有多個字串變數包含了同樣的字串實際值時,CLR可能不會為它們重複地分配記憶體,而是讓它們統統指向同一個字串對象執行個體。
剛開始學習C#的時候,就聽說CLR對於String類有一種特別的記憶體管理機制:有時候,明明聲明了兩個String類的對象,但是他們偏偏卻指向同一個執行個體。如下:
String s1 = "Hello";
String s2 = "Hello";
//s2和s1的實際值都是Hello
bool same = (object) s1 == (object) s2;
//這裡比較s1、s2是否引用了同一個對象執行個體
//所以不能寫作bool same = s1 == s2;
//因為String類重載了==操作符來比較String對象包含的實際值
這裡的same會被賦值為true。也就是說s1真的和s2引用了同一個String對象。當然,應該注意到的是s1和s2都被統一賦值為同一個字串Hello,這才是出現上述情況的原因。
現在我們初步得出結論,當有多個字串變數包含了同樣的字串實際值時,CLR可能不會為它們重複地分配記憶體,而是讓它們統統指向同一個字串對象執行個體。(這裡我說了可能,是因為某些情況下,確實也會發生同一個字串實際值在記憶體中有多份副本同時存在。請繼續往下看。)
我們知道,String類有很多特別的地方,其中之一就是它是不可變性(immutable)。這說明在我們每次對一個String對象進行操作時(比如說使用Trim,Replace等方法),並不是真的對這個String對象的執行個體進行修改,而是返回一個新的String對象執行個體作為操作執行的結果。String對象的執行個體一經產生,到死都不會被改變了!
基於String類這樣的特性,CLR讓表示相同的字串實際值的變數指向同一個String案例,就是完全合理的了。因為利用任何一個對String執行個體的引用所進行的修改操作都不會切實地影響到該執行個體的狀態,也就不會影響到其他所有指向該執行個體的引用所表示的字串實際值。CLR如此管理String類的記憶體配置,可以最佳化記憶體的使用方式,避免記憶體中包含冗餘的資料。
為了實現這個機制,CLR默默地維護了一個叫做駐留池(Intern Pool)的表。這個表記錄了所有在代碼中使用字面量聲明的字串執行個體的引用。這說明使用字面量聲明的字串會進入駐留池,而其他方式聲明的字串並不會進入,也就不會自動享受到CLR防止字串冗餘的機制的好處了。這就是我上文提到的某些情況下,確實也會發生同一個字串實際值在記憶體中有多份副本同時存在的例子。請看這個例子:
StringBuilder sb = new StringBuilder();
sb.Append("He").Append("llo");
string s1 = "Hello";
string s2 = sb.ToString();
bool same = (object) s1 == (object) s2;
這時same就不是true了,因為雖然s1,s2表示的是相同的字串,但是由於s2不是通過字面量聲明的,CLR在為sb.ToString()方法的返回值分配記憶體時,並不會到駐留池中去檢查是否有值為Hello的字串已經存在了,所以自然不會讓s2指向駐留池內的對象。
為了讓編程者能夠強制CLR檢查駐留池,以避免冗餘的字串副本,String類的設計者提供了一個名為Intern的類方法。下面是該方法的一個樣本:
StringBuilder sb = new StringBuilder();
sb.Append("He").Append("llo");
string s1 = "Hello";
string s2 = String.Intern(sb.ToString());
bool same = (object) s1 == (object) s2;
好了,same又是true了。
Intern方法接受一個字串作為參數,它會在駐留池中檢查是否存在參數所表示的字串。
如果存在,則返回那個駐留池中的字串的引用;否則向駐留池中加入一個新的表示相同值的字串,並返回這個字串的引用。不過要注意的是,就算Intern方法在駐留池中找到了相同值的字串,也不能讓您省卻一次字串記憶體配置的操作,因為作為參數的字串已經被分配了一次記憶體了。而使用Intern方法的好處在於,如果Intern方法在駐留池中找到了相同值的字串,此時雖然在記憶體中存在兩份該字串的副本(一份是參數,一份是駐留池中的),但是隨著時間的流逝,參數所引用的那個副本會被記憶體回收掉,這樣對於該字串記憶體中就不存在冗餘了。
當您的程式中存在某個方法,可以根據不同的上下文環境建立並返回一個很長的字串,而在程式啟動並執行過程中它有會經常返回同樣的字串時,您可能就要考慮考慮使用Intern方法來提高記憶體的利用率了。
不過同樣值得注意的是,使用Intern方法讓一個字串存活於駐留池中也有一個副作用:即使已經不存在任何其它引用指向駐留池中的字串了,這個字串仍然不一定會被記憶體回收掉。也就是說即使駐留池中的字串已經沒有用處了,它可能也要等到CLR終結時才被銷毀。當您使用Intern方法的時候,也應該考慮到這個特殊的行為。