標籤:
與前面介紹的鎖和volatile相比較,對final域的讀和寫更像是普通的變數訪問。對於final域,編譯器和處理器要遵守兩個重定序:
- 在建構函式內對一個final域的寫入,與隨後把這個被構造對象的引用賦值給一個引用變數,這兩個操作之間不能重排序。
- 初次讀一個包含final域的對象的引用,與隨後初次讀這個final域,這兩個操作之間不能重排序。
下面,我們通過一些樣本性的代碼來分別說明這兩個規則:
public class FinalExample { int i; //普通變數 final int j; //final變數 static FinalExample obj; public void FinalExample () { //建構函式 i = 1; //寫普通域 j = 2; //寫final域 } public static void writer () { //寫線程A執行 obj = new FinalExample (); } public static void reader () { //讀線程B執行 FinalExample object = obj; //讀對象引用 int a = object.i; //讀普通域 int b = object.j; //讀final域 }}
這裡假設一個線程A執行writer ()方法,隨後另一個線程B執行reader ()方法。下面我們通過這兩個線程的互動來說明這兩個規則。
寫final域的重定序
寫final域的重定序禁止把final域的寫重排序到建構函式之外。這個規則的實現包含下面2個方面:
- JMM禁止編譯器把final域的寫重排序到建構函式之外。
- 編譯器會在final域的寫之後,建構函式return之前,插入一個StoreStore屏障。這個屏障禁止處理器把final域的寫重排序到建構函式之外。
現在讓我們分析writer ()方法。writer ()方法只包含一行代碼:finalExample = new FinalExample ()。這行程式碼封裝含兩個步驟:
- 構造一個FinalExample類型的對象;
- 把這個對象的引用賦值給引用變數obj。
假設線程B讀對象引用與讀對象的成員域之間沒有重排序(馬上會說明為什麼需要這個假設),是一種可能的執行時序:
在中,寫普通域的操作被編譯器重排序到了建構函式之外,讀線程B錯誤的讀取了普通變數i初始化之前的值。而寫final域的操作,被寫final域的重定序“限定”在了建構函式之內,讀線程B正確的讀取了final變數初始化之後的值。
寫final域的重定序可以確保:在對象引用為任意線程可見之前,對象的final域已經被正確初始化過了,而普通域不具有這個保障。以為例,在讀線程B“看到”對象引用obj時,很可能obj對象還沒有構造完成(對普通域i的寫操作被重排序到建構函式外,此時初始值2還沒有寫入普通域i)。
讀final域的重定序
讀final域的重定序如下:
- 在一個線程中,初次讀對象引用與初次讀該對象包含的final域,JMM禁止處理器重排序這兩個操作(注意,這個規則僅僅針對處理器)。編譯器會在讀final網域作業的前面插入一個LoadLoad屏障。
初次讀對象引用與初次讀該對象包含的final域,這兩個操作之間存在間接依賴關係。由於編譯器遵守間接依賴關係,因此編譯器不會重排序這兩個操作。大多數處理器也會遵守間接依賴,大多數處理器也不會重排序這兩個操作。但有少數處理器允許對存在間接依賴關係的操作做重排序(比如alpha處理器),這個規則就是專門用來針對這種處理器。
reader()方法包含三個操作:
- 初次讀引用變數obj;
- 初次讀引用變數obj指向對象的普通域j。
- 初次讀引用變數obj指向對象的final域i。
現在我們假設寫線程A沒有發生任何重排序,同時程式在不遵守間接依賴的處理器上執行,下面是一種可能的執行時序:
在中,讀對象的普通域的操作被處理器重排序到讀對象引用之前。讀普通域時,該域還沒有被寫線程A寫入,這是一個錯誤的讀取操作。而讀final域的重定序會把讀對象final域的操作“限定”在讀對象引用之後,此時該final域已經被A線程初始化過了,這是一個正確的讀取操作。
讀final域的重定序可以確保:在讀一個對象的final域之前,一定會先讀包含這個final域的對象的引用。在這個樣本程式中,如果該引用不為null,那麼引用對象的final域一定已經被A線程初始化過了。
如果final域是參考型別
上面我們看到的final域是基礎資料類型,下面讓我們看看如果final域是參考型別,將會有什麼效果?
請看下列範例程式碼:
public class FinalReferenceExample {final int[] intArray; //final是參考型別static FinalReferenceExample obj;public FinalReferenceExample () { //建構函式 intArray = new int[1]; //1 intArray[0] = 1; //2}public static void writerOne () { //寫線程A執行 obj = new FinalReferenceExample (); //3}public static void writerTwo () { //寫線程B執行 obj.intArray[0] = 2; //4}public static void reader () { //讀線程C執行 if (obj != null) { //5 int temp1 = obj.intArray[0]; //6 }}}
這裡final域為一個參考型別,它引用一個int型的數組對象。對於參考型別,寫final域的重定序對編譯器和處理器增加了如下約束:
- 在建構函式內對一個final引用的對象的成員域的寫入,與隨後在建構函式外把這個被構造對象的引用賦值給一個引用變數,這兩個操作之間不能重排序。
對上面的樣本程式,我們假設首先線程A執行writerOne()方法,執行完後線程B執行writerTwo()方法,執行完後線程C執行reader ()方法。下面是一種可能的線程執行時序:
在中,1是對final域的寫入,2是對這個final域引用的對象的成員域的寫入,3是把被構造的對象的引用賦值給某個引用變數。這裡除了前面提到的1不能和3重排序外,2和3也不能重排序。
JMM可以確保讀線程C至少能看到寫線程A在建構函式中對final引用對象的成員域的寫入。即C至少能看到數組下標0的值為1。而寫線程B對數組元素的寫入,讀線程C可能看的到,也可能看不到。JMM不保證線程B的寫入對讀線程C可見,因為寫線程B和讀線程C之間存在資料競爭,此時的執行結果不可預知。
如果想要確保讀線程C看到寫線程B對數組元素的寫入,寫線程B和讀線程C之間需要使用同步原語(lock或volatile)來確保記憶體可見度。
為什麼final引用不能從建構函式內“逸出”
前面我們提到過,寫final域的重定序可以確保:在引用變數為任意線程可見之前,該引用變數指向的對象的final域已經在建構函式中被正確初始化過了。其實要得到這個效果,還需要一個保證:在建構函式內部,不能讓這個被構造對象的引用為其他線程可見,也就是對象引用不能在建構函式中“逸出”。為了說明問題,讓我們來看下面範例程式碼:
public class FinalReferenceEscapeExample {final int i;static FinalReferenceEscapeExample obj;public FinalReferenceEscapeExample () { i = 1; //1寫final域 obj = this; //2 this引用在此“逸出”}public static void writer() { new FinalReferenceEscapeExample ();}public static void reader { if (obj != null) { //3 int temp = obj.i; //4 }}}
假設一個線程A執行writer()方法,另一個線程B執行reader()方法。這裡的操作2使得對象還未完成構造前就為線程B可見。即使這裡的操作2是建構函式的最後一步,且即使在程式中操作2排在操作1後面,執行read()方法的線程仍然可能無法看到final域被初始化後的值,因為這裡的操作1和操作2之間可能被重排序。實際的執行時序可能如所示:
從我們可以看出:在建構函式返回前,被構造對象的引用不能為其他線程可見,因為此時的final域可能還沒有被初始化。在建構函式返回後,任意線程都將保證能看到final域正確初始化之後的值。
final語義在處理器中的實現
現在我們以x86處理器為例,說明final語義在處理器中的具體實現。
上面我們提到,寫final域的重定序會要求譯編器在final域的寫之後,建構函式return之前,插入一個StoreStore障屏。讀final域的重定序要求編譯器在讀final域的操作前面插入一個LoadLoad屏障。
由於x86處理器不會對寫-寫操作做重排序,所以在x86處理器中,寫final域需要的StoreStore障屏會被省略掉。同樣,由於x86處理器不會對存在間接依賴關係的操作做重排序,所以在x86處理器中,讀final域需要的LoadLoad屏障也會被省略掉。也就是說在x86處理器中,final域的讀/寫不會插入任何記憶體屏障!
JSR-133為什麼要增強final的語義
在舊的Java記憶體模型中 ,最嚴重的一個缺陷就是線程可能看到final域的值會改變。比如,一個線程當前看到一個整形final域的值為0(還未初始化之前的預設值),過一段時間之後這個線程再去讀這個final域的值時,卻發現值變為了1(被某個線程初始化之後的值)。最常見的例子就是在舊的Java記憶體模型中,String的值可能會改變(參考文獻2中有一個具體的例子,感興趣的讀者可以自行參考,這裡就不贅述了)。
為了修補這個漏洞,JSR-133專家組增強了final的語義。通過為final域增加寫和讀重定序,可以為java程式員提供初始化安全保證:只要對象是正確構造的(被構造對象的引用在建構函式中沒有“逸出”),那麼不需要使用同步(指lock和volatile的使用),就可以保證任意線程都能看到這個final域在建構函式中被初始化之後的值。
深入理解Java記憶體模型(六)——final