標籤:extra 理由 app win 不能 編寫 標識 div 隨機數產生
原文:http://www.ibm.com/developerworks/cn/java/j-jtp10264/index.html
多線程和並發性並不是什麼新內容,但是 Java 語言設計中的創新之一就是,它是第一個直接把跨平台執行緒模式和正規的記憶體模型整合到語言中的主流語言。核心類庫包含一個 Thread
類,可以用它來構建、啟動和操縱線程,Java 語言套件括了跨線程傳達並發性約束的構造 —— synchronized
和 volatile
。在簡化與平台無關的並發類的開發的同時,它決沒有使並發類的編寫工作變得更繁瑣,只是使它變得更容易了。
synchronized 快速回顧
把代碼塊聲明為 synchronized,有兩個重要後果,通常是指該代碼具有 原子性(atomicity)和 可見度(visibility)。原子性意味著一個線程一次只能執行由一個指定監控對象(lock)保護的代碼,從而防止多個線程在更新共用狀態時相互衝突。可見度則更為微妙;它要對付記憶體緩衝和編譯器最佳化的各種反常行為。一般來說,線程以某種不必讓其他線程立即可以看到的方式(不管這些線程在寄存器中、在處理器特定的緩衝中,還是通過指令重排或者其他編譯器最佳化),不受緩衝變數值的約束,但是如果開發人員使用了同步,如下面的代碼所示,那麼運行庫將確保某一線程對變數所做的更新先於對現有 synchronized
塊所進行的更新,當進入由同一監控器(lock)保護的另一個 synchronized
塊時,將立刻可以看到這些對變數所做的更新。類似的規則也存在於 volatile
變數上。
synchronized (lockObject) { // update object state}
所以,實現同步操作需要考慮安全更新多個共用變數所需的一切,不能有競爭條件,不能破壞資料(假設同步的邊界位置正確),而且要保證正確同步的其他線程可以看到這些變數的最新值。通過定義一個清晰的、跨平台的記憶體模型(該模型在 JDK 5.0 中做了修改,改正了原來定義中的某些錯誤),通過遵守下面這個簡單規則,構建“一次編寫,隨處運行”的並發類是有可能的:
不論什麼時候,只要您將編寫的變數接下來可能被另一個線程讀取,或者您將讀取的變數最後是被另一個線程寫入的,那麼您必須進行同步。
不過現在好了一點,在最近的 JVM 中,沒有爭用的同步(一個線程擁有鎖的時候,沒有其他線程企圖獲得鎖)的效能成本還是很低的。(也不總是這樣;早期 JVM 中的同步還沒有最佳化,所以讓很多人都這樣認為,但是現在這變成了一種誤解,人們認為不管是不是爭用,同步都有很高的效能成本。)
對 synchronized 的改進
如此看來同步相當好了,是嗎?那麼為什麼 JSR 166 小組花了這麼多時間來開發 java.util.concurrent.lock
架構呢?答案很簡單-同步是不錯,但它並不完美。它有一些功能性的限制 —— 它無法中斷一個正在等候獲得鎖的線程,也無法通過投票得到鎖,如果不想等下去,也就沒法得到鎖。同步還要求鎖的釋放只能在與獲得鎖所在的堆疊框架相同的堆疊框架中進行,多數情況下,這沒問題(而且與異常處理互動得很好),但是,確實存在一些非塊結構的鎖定更合適的情況。
ReentrantLock 類
java.util.concurrent.lock
中的 Lock
架構是鎖定的一個抽象,它允許把鎖定的實現作為 Java 類,而不是作為語言的特性來實現。這就為 Lock
的多種實現留下了空間,各種實現可能有不同的調度演算法、效能特性或者鎖定語義。 ReentrantLock
類實現了 Lock
,它擁有與 synchronized
相同的並發性和記憶體語義,但是添加了類似鎖投票、定時鎖等候和可中斷鎖等候的一些特性。此外,它還提供了在激烈爭用情況下更佳的效能。(換句話說,當許多線程都想訪問共用資源時,JVM 可以花更少的時候來調度線程,把更多時間用在執行線程上。)
reentrant 鎖意味著什麼呢?簡單來說,它有一個與鎖相關的擷取計數器,如果擁有鎖的某個線程再次得到鎖,那麼擷取計數器就加1,然後鎖需要被釋放兩次才能獲得真正釋放。這模仿了synchronized
的語義;如果線程進入由線程已經擁有的監控器保護的 synchronized 塊,就允許線程繼續進行,當線程退出第二個(或者後續) synchronized
塊的時候,不釋放鎖,只有線程退出它進入的監控器保護的第一個 synchronized
塊時,才釋放鎖。
在查看清單 1 中的程式碼範例時,可以看到 Lock
和 synchronized 有一點明顯的區別 —— lock 必須在 finally 塊中釋放。否則,如果受保護的代碼將拋出異常,鎖就有可能永遠得不到釋放!這一點區別看起來可能沒什麼,但是實際上,它極為重要。忘記在 finally 塊中釋放鎖,可能會在程式中留下一個定時炸彈,當有一天炸彈爆炸時,您要花費很大力氣才有找到源頭在哪。而使用同步,JVM 將確保鎖會獲得自動釋放。
清單 1. 用 ReentrantLock 保護代碼塊。
Lock lock = new ReentrantLock();lock.lock();try { // update object state}finally { lock.unlock(); }
除此之外,與目前的 synchronized 實現相比,爭用下的 ReentrantLock
實現更具延展性。(在未來的 JVM 版本中,synchronized 的爭用效能很有可能會獲得提高。)這意味著當許多線程都在爭用同一個鎖時,使用 ReentrantLock
的總體開支通常要比 synchronized
少得多。
比較 ReentrantLock 和 synchronized 的延展性
Tim Peierls 用一個簡單的線性全等偽隨機數產生器(PRNG)構建了一個簡單的評測,用它來測量 synchronized
和 Lock
之間相對的延展性。這個樣本很好,因為每次調用 nextRandom()
時,PRNG 都確實在做一些工作,所以這個基準程式實際上是在測量一個合理的、真實的 synchronized
和 Lock
應用程式,而不是測試純粹紙上談兵或者什麼也不做的代碼(就像許多所謂的基準程式一樣。)
在這個基準程式中,有一個 PseudoRandom
的介面,它只有一個方法 nextRandom(int bound)
。該介面與 java.util.Random
類的功能非常類似。因為在產生下一個隨機數時,PRNG 用最新產生的數字作為輸入,而且把最後產生的數字作為一個執行個體變數來維護,其重點在於讓更新這個狀態的程式碼片段不被其他線程搶佔,所以我要用某種形式的鎖定來確保這一點。( java.util.Random
類也可以做到這點。)我們為 PseudoRandom
構建了兩個實現;一個使用 syncronized,另一個使用 java.util.concurrent.ReentrantLock
。驅動程式產生了大量線程,每個線程都瘋狂地爭奪時間片,然後計算不同版本每秒能執行多少輪。圖 1 和 圖 2 總結了不同線程數量的結果。這個評測並不完美,而且只在兩個系統上運行了(一個是雙 Xeon 運行超執行緒 Linux,另一個是單一處理器 Windows 系統),但是,應當足以表現 synchronized
與 ReentrantLock
相比所具有的伸縮性優勢了。
圖 1 和圖 2 中的圖表以每秒調用數為單位顯示了吞吐率,把不同的實現調整到 1 線程 synchronized
的情況。每個實現都相對迅速地集中在某個穩定點的吞吐率上,該狀態通常要求處理器得到充分利用,把大多數的處理器時間都花在處理實際工作(電腦隨機數)上,只有小部分時間花在了線程調度開支上。您會注意到,synchronized 版本在處理任何類型的爭用時,表現都相當差,而 Lock
版本在調度的開支上花的時間相當少,從而為更高的吞吐率留下空間,實現了更有效 CPU 利用。
條件變數
根類 Object
包含某些特殊的方法,用來線上程的 wait()
、 notify()
和 notifyAll()
之間進行通訊。這些是進階的並發性特性,許多開發人員從來沒有用過它們 —— 這可能是件好事,因為它們相當微妙,很容易使用不當。幸運的是,隨著 JDK 5.0 中引入 java.util.concurrent
,開發人員幾乎更加沒有什麼地方需要使用這些方法了。
通知與鎖定之間有一個互動 —— 為了在對象上 wait
或 notify
,您必須持有該對象的鎖。就像 Lock
是同步的概括一樣, Lock
架構套件含了對 wait
和 notify
的概括,這個概括叫作 條件(Condition)
。 Lock
對象則充當綁定到這個鎖的條件變數的工廠對象,與標準的 wait
和 notify
方法不同,對於指定的 Lock
,可以有不止一個條件變數與它關聯。這樣就簡化了許多並發演算法的開發。例如, 條件(Condition)
的 Javadoc 顯示了一個有界緩衝區實現的樣本,該樣本使用了兩個條件變數,“not full”和“not empty”,它比每個 lock 只用一個 wait 設定的實現方式可讀性要好一些(而且更有效)。 Condition
的方法與 wait
、 notify
和 notifyAll
方法類似,分別命名為 await
、 signal
和 signalAll
,因為它們不能覆蓋 Object
上的對應方法。
這不公平
如果查看 Javadoc,您會看到, ReentrantLock
構造器的一個參數是 boolean 值,它允許您選擇想要一個 公平(fair)鎖,還是一個 不公平(unfair)鎖。公平鎖使線程按照請求鎖的順序依次獲得鎖;而不公平鎖則允許討價還價,在這種情況下,線程有時可以比先請求鎖的其他線程先得到鎖。
為什麼我們不讓所有的鎖都公平呢?畢竟,公平是好事,不公平是不好的,不是嗎?(當孩子們想要一個決定時,總會叫嚷“這不公平”。我們認為公平非常重要,孩子們也知道。)在現實中,公平保證了鎖是非常健壯的鎖,有很大的效能成本。要確保公平所需要的記帳(bookkeeping)和同步,就意味著被爭奪的公平鎖要比不公平鎖的吞吐率更低。作為預設設定,應當把公平設定為 false
,除非公平對您的演算法至關重要,需要嚴格按照線程排隊的順序對其進行服務。
那麼同步又如何呢?內建的監控器鎖是公平的嗎?答案令許多人感到大吃一驚,它們是不公平的,而且永遠都是不公平的。但是沒有人抱怨過線程饑渴,因為 JVM 保證了所有線程最終都會得到它們所等候的鎖。確保統計上的公平性,對多數情況來說,這就已經足夠了,而這花費的成本則要比絕對的公平保證的低得多。所以,預設情況下 ReentrantLock
是“不公平”的,這一事實只是把同步中一直是事件的東西表面化而已。如果您在同步的時候並不介意這一點,那麼在 ReentrantLock
時也不必為它擔心。
圖 3 和圖 4 包含與 圖 1和 圖 2 相同的資料,只是添加了一個資料集,用來進行隨機數基準檢測,這次檢測使用了公平鎖,而不是預設的協商鎖。正如您能看到的,公平是有代價的。如果您需要公平,就必須付出代價,但是請不要把它作為您的預設選擇。
處處都好?
看起來 ReentrantLock
無論在哪方面都比 synchronized
好 —— 所有 synchronized
能做的,它都能做,它擁有與 synchronized
相同的記憶體和並發性語義,還擁有 synchronized
所沒有的特性,在負荷下還擁有更好的效能。那麼,我們是不是應當忘記 synchronized
,不再把它當作已經已經得到最佳化的好主意呢?或者甚至用 ReentrantLock
重寫我們現有的 synchronized
代碼?實際上,幾本 Java 編程方面介紹性的書籍在它們多線程的章節中就採用了這種方法,完全用 Lock
來做樣本,只把 synchronized 當作曆史。但我覺得這是把好事做得太過了。
還不要拋棄 synchronized
雖然 ReentrantLock
是個非常動人的實現,相對 synchronized 來說,它有一些重要的優勢,但是我認為急於把 synchronized 視若敝屣,絕對是個嚴重的錯誤。 java.util.concurrent.lock
中的鎖定類是用於進階使用者和進階情況的工具 。一般來說,除非您對 Lock
的某個進階特性有明確的需要,或者有明確的證據(而不是僅僅是懷疑)表明在特定情況下,同步已經成為延展性的瓶頸,否則還是應當繼續使用 synchronized。
為什麼我在一個顯然“更好的”實現的使用上主張保守呢?因為對於 java.util.concurrent.lock
中的鎖定類來說,synchronized 仍然有一些優勢。比如,在使用 synchronized 的時候,不能忘記釋放鎖;在退出 synchronized
塊時,JVM 會為您做這件事。您很容易忘記用 finally
塊釋放鎖,這對程式非常有害。您的程式能夠通過測試,但會在實際工作中出現死結,那時會很難指出原因(這也是為什麼根本不讓初級開發人員使用 Lock
的一個好理由。)
另一個原因是因為,當 JVM 用 synchronized 管理鎖定請求和釋放時,JVM 在產生線程轉儲時能夠包括鎖定資訊。這些對調試非常有價值,因為它們能標識死結或者其他異常行為的來源。Lock
類只是普通的類,JVM 不知道具體哪個線程擁有 Lock
對象。而且,幾乎每個開發人員都熟悉 synchronized,它可以在 JVM 的所有版本中工作。在 JDK 5.0 成為標準(從現在開始可能需要兩年)之前,使用 Lock
類將意味著要利用的特性不是每個 JVM 都有的,而且不是每個開發人員都熟悉的。
什麼時候選擇用 ReentrantLock 代替 synchronized
既然如此,我們什麼時候才應該使用 ReentrantLock
呢?答案非常簡單 —— 在確實需要一些 synchronized 所沒有的特性的時候,比如時間鎖等候、可中斷鎖等候、無塊結構鎖、多個條件變數或者鎖投票。 ReentrantLock
還具有延展性的好處,應當在高度爭用的情況下使用它,但是請記住,大多數 synchronized 塊幾乎從來沒有出現過爭用,所以可以把高度爭用放在一邊。我建議用 synchronized 開發,直到確實證明 synchronized 不合適,而不要僅僅是假設如果使用 ReentrantLock
“效能會更好”。請記住,這些是供進階使用者使用的進階工具。(而且,真正的進階使用者喜歡選擇能夠找到的最簡單工具,直到他們認為簡單的工具不適用為止。)。一如既往,首先要把事情做好,然後再考慮是不是有必要做得更快。
Lock
架構是同步的相容替代品,它提供了 synchronized
沒有提供的許多特性,它的實現在爭用下提供了更好的效能。但是,這些明顯存在的好處,還不足以成為用 ReentrantLock
代替 synchronized
的理由。相反,應當根據您是否 需要 ReentrantLock
的能力來作出選擇。大多數情況下,您不應當選擇它 —— synchronized 工作得很好,可以在所有 JVM 上工作,更多的開發人員瞭解它,而且不太容易出錯。只有在真正需要 Lock
的時候才用它。在這些情況下,您會很高興擁有這款工具。
Java中的ReentrantLock和synchronized兩種鎖定機制的對比