提高Java的伸縮性 JVM效能最佳化

來源:互聯網
上載者:User

標籤:

很多程式員在解決JVM效能問題的時候,花開了很多時間去調優應用程式層級的效能瓶頸,當你讀完這本系列文章之後你會發現我可能更加系統地看待這類的問題。我說過JVM的自身技術限制了Java企業級應用的伸縮性。首先我們先列舉一些主導因素。

  • 主流的硬體伺服器提供了大量的記憶體
  • 分布式系統有大量記憶體的需求,而且該需求在持續增長
  • 一個普通Java應用程式所持有的對空間大概在1GB~4GB,這遠遠低於一個硬體伺服器的記憶體管理能力以及一個分布式應用程式的記憶體需求量。這被稱之為Java記憶體牆,如所示(圖中表述Java應用伺服器和常規Java應用的記憶體使用量量的演變史)。

圖 1 Java記憶體牆(1980~2010)

 

這給我們帶來了如下JVM效能課題:

1)    如果分配給應用程式的記憶體太小,將導致記憶體不足。JVM 不能及時釋放記憶體空間給應用程式,最終將引發記憶體不足,或者JVM完全關閉。所以你必須提供更多的記憶體給應用程式。

2)    如果給對回應時間敏感的應用增加記憶體,如果不重啟你的系統或者最佳化你的應用,Java堆最終會片段化。當片段發生時,可能會導致應用中斷100毫秒~100秒,這取決與你的Java應用,Java堆的大小以及其他的JVM調優參數。

關於停頓的討論大部分都集中在平均停頓或者目標停頓,很少涉及到堆壓縮時的最壞停頓時間,在生產環境中堆中每千MB的有效資料的都將會發生大約1秒的停頓。

2~4秒的停頓對大多數公司專屬應用程式來說都是不能接受的,所以儘管實際的Java應用執行個體可能需要更多的記憶體空間,但實際只分配2~4GB的記憶體。在一些64位系統中帶有很多關於伸縮性的JVM調優項,使得這些系統可以運行16GB乃至20GB的堆空間,並能滿足典型回應時間的SLA。但是這些離現實較遠,JVM目前的技術無法在進行堆壓縮時避免停頓應用程式。Java應用開發人員苦於處理這兩個為我們大多數人所抱怨的任務。

  • 架構/建模在大量的執行個體池之上,隨之而來的是複雜的監控和管理操作。
  • 反覆的JVM和應用程式調優以避免“stop the world“引起的停頓。大多數程式員希望停頓不要發生在系統峰值負載期間。我稱之為不可能的目標。

現在讓我們深入一點Java的延展性問題。

為了充分利用記憶體資源,普通的做法是將Java應用部署在多個應用伺服器執行個體上而不是一個或者少數應用伺服器執行個體上。當一台Server上運行16 個應用伺服器執行個體可以充分利用所有的記憶體資源,但如此無法解決的是多執行個體的監控以及管理所帶來的成本,尤其是當你的應用部署在多個Server上。

另一個問題來了,峰值負載時的記憶體資源不是每天都需要的,這樣就形成了巨大的浪費。有些情況下,一台物理機上可能只不是不超過3個“大應用伺服器執行個體”,這樣的部署更加不夠經濟也不夠環保,尤其在非峰值負載期間。

讓我們來比較一下這兩種部署架構,中左邊是多而小的應用伺服器執行個體部署模式,右邊是少而大的應用伺服器執行個體部署模式。兩種模式處理同樣的負載,究竟哪一種部署架構更具經濟性。

圖2 大應用伺服器部署情境

 

如我之前說過的,並發壓縮使得大應用伺服器部署模式變得可行,而且可以突破JVM延展性的限制。目前只有Azul的Zing JVM可以提供並發壓縮的技術,另外Zing是Server側的JVM,我們很樂意看到越來越多的開發人員在JVM層面去挑戰Java延展性的問題。

由於效能調優仍然是我們解決Java延展性問題的主要手段,我們先來看有哪些主要的調優參數以及通過它們能達到什麼樣的效果。

調優參數:一些案例

最著名的調優參數莫過於”-Xmx”了,通過該參數可以指定Java的堆空間大小,實際上可能不同的JVM執行結果不太一樣。

有的JVM包含了內部結構(如編譯器線程,記憶體回收行程結構,代碼緩衝等等)所需要的記憶體在“-Xmx”的設定中,而有的則不包含。因此使用者Java進程的大小不一定跟“-Xmx”的設定相吻合。

如果你的應用程式指派至的速率,對象的生命週期,或者對象的大小超過了JVM記憶體相關配置,一旦達到最大可使用記憶體的閾值將會發生記憶體溢出,使用者進程則會停止。

當你的應用程式糾結於記憶體的可用性時,最有效方法就是通過”-Xmx”指定更大的記憶體去重啟當前應用進程。為了避免頻繁的重啟,大多數企業生產環境都傾向於指定峰值負載時所需要的記憶體,造成過度配置最佳化。

提示:生產環境負載的調整

Java開發人員易犯的常見錯誤是在實驗下的做的堆記憶體設定,在移植到生產環境是忘記重新調整。生產環境和實驗室環境是不一樣的,謹記根據生產環境的負載重新調整堆記憶體設定。

分代記憶體回收行程調優

還有一些其他的最佳化選項”-Xns”和”-XX: NewSize”,用來調整年輕代的大小,用來指定堆中專門負責新對象分配的空間大小。

大多數開發人員都試圖基於實驗室環境調整年輕代的大小,這意味著在生產負載下存在失敗的風險。一般新生代的大小設定為堆大小的三分之一至二分之一左右,但這不是一個準則,畢竟實際還要視應用程式邏輯而定。因此最好先調查清楚年輕代到年老代的蛻變率以及年老代對象的大小,在此基礎上(確保年老代的大小,年老代過小會頻繁促發GC導致記憶體溢出錯誤)儘可能地調大年輕代的空間。

還有一個與年輕代相關的調優項”-XX:SurvivorRatio”,該選項用來指定年輕代中對象的生命週期,超過指定時間長度相關對象將被移至年老代。為了”正確”地設定該值,你需要知道年輕代空間回收的頻率,能夠估算到新對象在應用程式進程中被引用的時間長度,同時也取決於分配率。

並發記憶體回收調優

針對對停頓敏感的應用,建議使用並發記憶體回收,雖然並行的辦法能夠帶來非常好的輸送量基準測試分數,但是並行GC不利於縮短回應時間。並發 GC 是目前唯一有效實現一致性和最少“stop the world”中斷的方法。不同的JVM提供不同的並發GC的設定,Oracle JVM(hotspot)提供”-XX:+UseConcMarkSweepGC”,今後G1將成為Oracle JVM預設的並發記憶體回收行程。

效能調優並不是真正的解決辦法

或許你已經注意到上文中在討論如何“正確“地設定調優此參數時,我刻意在”正確“二字上加了雙引號。那是因為就我個人經驗而言一旦涉及到績效參數調優,就沒有嚴格意義上的正確設定。每一個設定值都是針對特定的情境。考慮到應用情境會發生變化,JVM 效能調整充其量是一個權宜之計。

以堆的設定為例:如果2GB的堆可以應對20萬並發使用者,但是可能不能應付40萬的並發使用者。

我們再以”-XX:SurvivorRatio”為例:當設定符合一個負載持續增長最高至每毫秒10000個交易的情境,當壓力到達每毫秒50000個交易時又會發生什麼呢?

大多數企業級應用負載都是動態,Java語言的動態記憶體管理以及動態編譯等技術使得Java更加適合企業級應用。我們來看看一下兩個配置清單。

清單1. 應用程式(1)的啟動選項

>java -Xmx12g -XX:MaxPermSize=64M -XXermSize=32M -XX:MaxNewSize=2g -XX:NewSize=1g -XX:SurvivorRatio=16 -XX:+UseParNewGC -XX:+UseConcMarkSweepGC -XX:MaxTenuringThreshold=0 -XX:CMSInitiatingOccupancyFraction=60 -XX:+CMSParallelRemarkEnabled -XX:+UseCMSInitiatingOccupancyOnly -XXarallelGCThreads=12 -XXargePageSizeInBytes=256m …

清單 2. 應用程式(2)的啟動選項

>java –Xms8g –Xmx8g –Xmn2g -XXermSize=64M -XX:MaxPermSize=256M -XX:-OmitStackTraceInFastThrow -XX:SurvivorRatio=2 -XX:-UseAdaptiveSizePolicy -XX:+UseConcMarkSweepGC -XX:+CMSConcurrentMTEnabled -XX:+CMSParallelRemarkEnabled -XX:+CMSParallelSurvivorRemarkEnabled -XX:CMSMaxAbortablePrecleanTime=10000 -XX:+UseCMSInitiatingOccupancyOnly -XX:CMSInitiatingOccupancyFraction=63 -XX:+UseParNewGC –Xnoclassgc …

兩者的配置區別很大,因為他們是兩個不同應用程式。感覺根據各自的應用特設都做了”正確“的配置與調優。在實驗室環境下都運行良好,但在生產環境中最終會表現出疲態。清單1由於沒有考慮到動態負載,到了生產環境即表現不良。清單2沒有考慮到應用程式在生產環境中的特性變化。這兩種情況應該歸咎於Team Dev,但是該歸咎於何處呢?

變通辦法可行嗎?

有些企業通過精確測量交易對象的大小定義極致的對象回收空間並”精簡“其架構來適配該空間。這也許是辦法來削減片段以應對一整天的交易(在不做堆壓縮的情況下)。還有一個辦法就是通過程式設計確保對象被引用的時間在一個比較短的時間內從而阻止其在SurvivorRatio時間之後不被遷往年老代而直接被回收,避免記憶體壓縮的情境。這兩種辦法都可以,但是對應用開發人員和設計人員有一定的挑戰。

誰保障應用程式的效能?

一個門戶應用可能會在其活動負載峰值點出現故障;一個交易應用可能會在每次市場下跌和上升時無法正常運行;電子商務網站可能會無法應對節假日購物高峰期。這些都是真實世界的案例基本都是JVM績效參數調優導致的。當產生了經濟損失,Team Dev就會受到責備。也許某些場合下Team Dev應該要受到責備,但是 JVM的供應商又應該負起什麼樣兒的責任呢?

首先JVM供應商應該要提供調優參數的優先順序,至少這在短期內還是很有意義的。有一些新的調優選項是針對特定的、新興的公司專屬應用程式程式情境。更多的調優選項是為了減輕JVM支援小組的工作負載而將效能最佳化轉嫁到應用開發人員身上。但我個人認為這或將導致更加漫長的支援負荷,一些針對最糟糕情境的調優選項也將被延期,當然不是無限延期。

毋庸置疑JVM的Team Dev也在努力地進行著他們的工作,同時也只有應用實施者才會更加清楚他們應用的特定需求。但是應用的實施者或開發人員是無法預測期動態負載需求。在過去,JVM供應商也會去分析關於Java的效能與可擴充性問題,哪些是他們能夠解決的。不是提供調優參數,而是直接去最佳化或創新記憶體回收的演算法。更有趣是我們可以想象一下如果OpenJDK的社區聚集在一起重新考慮Java記憶體回收行程將會發生什麼!

JVM效能的基準測試

調優參數有時被JVM供應商作為其競爭的工具,因為不同的調優可以改善他們的JVM在可預見的環境中的效能表現,本系列的最後一片文章中將調查這些基準測試來衡量JVM的效能。

JVM開發人員的挑戰

真正的企業級延展性需求是要求JVM能夠適應動態靈活的應用負載。這是在特定輸送量和回應時間內保證持續穩定效能的關鍵。這是JVM開發人員才能完成曆史使命,因此是時候號召我們Java開發人員社區來迎接真正的Java延展性的挑戰。

  • l  持續調優

對於給定的應用,在一開始需要告知其需要多大的記憶體,之後的工作都應該有JVM來負責 ,JVM需要適配動態應用負載和運行情境。

  • l  JVM執行個體數 vs. 執行個體的可擴充性

現在的伺服器都支援很大的記憶體,那麼為什麼JVM執行個體不能有效地利用它呢?將應用拆分部署許多小的應用伺服器執行個體上,這從經濟和環保角度都是一種浪費。現代的JVM需要跟上硬體和應用的發展潮流。

  • l  真實世界的效能和延展性

企業不需要為其應用的效能需求去做極致的效能調優。JVM供應商和OpenJDK社區需要去解決Java延展性的核心問題以及消除“stop the world“的操作。

結論

如果JVM做了這樣的工作,並且提供了並發壓縮的記憶體回收演算法,JVM也不再成為Java延展性的限制因素,Java應用開發人員不需要花費痛苦的時間理解怎樣配置JVM去獲得最佳效能,從而將會有更多的有趣的Java應用程式層面的創新,而不是無休止的JVM調優。我要挑戰JVM開發人員以及供應商所需要做的事情來響應甲骨文所提倡的“Make the Java Future“的活動。


關於作者

Eva Andearsson對JVM技術、SOA、雲端運算和其他企業級中介軟體解決方案有著10多年的從業經驗。在2001年,她以JRockit JVM開發人員的身份加盟了創業公司Appeal Virtual Solutions(即BEA公司的前身)。在記憶體回收領域的研究和演算法方面,EVA獲得了兩項專利。此外她還是提出了確定性記憶體回收(Deterministic Garbage Collection),後來形成了JRockit即時系統(JRockit Real Time)。在技術上,Eva與SUN公司和Intel公司合作密切,涉及到很多將JRockit產品線、WebLogic和Coherence整合的項目。2009年,Eva加盟了Azul System公,擔任產品經理。負責新的Zing Java平台的開發工作。最近,她改換門庭,以進階產品經理的身份加盟Cloudera公司,負責管理Cloudera公司Hadoop分布式系統,致力於高擴充性、分布式資料處理架構的開發。

 

原文來自: java TechFox IT技術論壇

提高Java的伸縮性 JVM效能最佳化

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.