如何進行HIBERNATE效能調優

最後更新：2018-12-04 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

大體上，對於HIBERNATE效能調優的主要考慮點如下:
Ø 資料庫設計調整
Ø HQL最佳化
Ø API的正確使用(如根據不同的業務類型選用不同的集合及查詢API)
Ø 主配置參數(日誌，查詢快取，fetch_size, batch_size等)
Ø 對應檔最佳化(ID建置原則，二級緩衝，消極式載入，關聯最佳化)
Ø 一級緩衝的管理
Ø 針對二級緩衝，還有許多特有的策略
Ø 事務控制策略。
1、資料庫設計
a) 降低關聯的複雜性
b) 盡量不使用聯合主鍵
c) ID的產生機制，不同的資料庫所提供的機制並不完全一樣
d) 適當的冗餘資料，不過分追求高範式
2、 HQL最佳化
HQL如果拋開它同HIBERNATE本身一些緩衝機制的關聯，HQL的最佳化技巧同普通的SQL最佳化技巧一樣，可以很容易在網上找到一些經驗之談。
3、主配置
a) 查詢快取，同下面講的緩衝不太一樣，它是針對HQL語句的緩衝，即完全一樣的語句再次執行時可以利用快取資料。但是，查詢快取在一個交易系統(資料變更頻繁，查詢條件相同的機率並不大)中可能會起反作用:它會白白耗費大量的系統資源但卻難以派上用場。
b) fetch_size，同JDBC的相關參數作用類似，參數並不是越大越好，而應根據業務特徵去設定
c) batch_size同上。
d) 生產系統中，切記要關掉SQL語句列印。
4、緩衝
a) 資料庫級緩衝:這級緩衝是最高效和安全的，但不同的資料庫可管理的層次並不一樣，比如，在ORACLE中，可以在建表時指定將整個表置於緩衝當中。
b) SESSION緩衝:在一個HIBERNATE SESSION有效，這級緩衝的可幹預性不強，大多於HIBERNATE自動管理，但它提供清除緩衝的方法，這在大批量增加/更新操作是有效。比如，同時增加十萬條記錄，按常規方式進行，很可能會發現OutofMemeroy的異常，這時可能需要手動清除這一級緩衝:Session.evict以及Session.clear
c) 應用緩衝:在一個SESSIONFACTORY中有效，因此也是最佳化的重中之重，因此，各類策略也考慮的較多，在將資料放入這一級緩衝之前，需要考慮一些前提條件:
i. 資料不會被第三方修改(比如，是否有另一個應用也在修改這些資料?)
ii. 資料不會太大
iii. 資料不會頻繁更新(否則使用CACHE可能適得其反)
iv. 資料會被頻繁查詢
v. 資料不是關鍵資料(如涉及錢，安全等方面的問題)。
緩衝有幾種形式，可以在對應檔中配置:read-only(唯讀，適用於很少變更的待用資料/曆史資料)，nonstrict-read-write，read-write(比較普遍的形式，效率一般)，transactional(JTA中，且支援的緩衝產品較少)
d) 分布式緩衝:同c)的配置一樣，只是緩衝產品的選用不同，在目前的HIBERNATE中可供選擇的不多，oscache, jboss cache，目前的大多數項目，對它們的用於叢集的使用(特別是關鍵交易系統)都持保守態度。在叢集環境中，只利用資料庫級的緩衝是最安全的。
5、消極式載入
a) 實體消極式載入:通過使用動態代理實現
b) 集合消極式載入:通過實現自有的SET/LIST，HIBERNATE提供了這方面的支援
c) 屬性消極式載入:
6、方法選用
a) 完成同樣一件事，HIBERNATE提供了可供選擇的一些方式，但具體使用什麼方式，可能用效能/代碼都會有影響。顯示，一次返回十萬條記錄(List/Set/Bag/Map等)進行處理，很可能導致記憶體不夠的問題，而如果用基於遊標(ScrollableResults)或Iterator的結果集，則不存在這樣的問題。
b) Session的load/get方法，前者會使用二級緩衝，而後者則不使用。
c) Query和list/iterator，如果去仔細研究一下它們，你可能會發現很多有意思的情況，二者主要區別(如果使用了Spring，在HibernateTemplate中對應find,iterator方法):
i. list只能利用查詢快取(但在交易系統中查詢快取作用不大)，無法利用二級緩衝中的單個實體，但list查出的對象會寫入二級緩衝，但它一般只產生較少的執行SQL語句，很多情況就是一條(無關聯)。
ii. iterator則可以利用二級緩衝，對於一條查詢語句，它會先從資料庫中找出所有合格記錄的ID，再通過ID去緩衝找，對於緩衝中沒有的記錄，再構造語句從資料庫中查出，因此很容易知道，如果緩衝中沒有任何合格記錄，使用iterator會產生N+1條SQL語句(N為合格記錄數)
iii. 通過iterator，配合緩衝管理API，在海量資料查詢中可以很好的解決記憶體問題，如:
while(it.hasNext()){
YouObject object = (YouObject)it.next();
session.evict(youObject);
sessionFactory.evice(YouObject.class, youObject.getId());
}
如果用list方法，很可能就出OutofMemory錯誤了。
iv. 通過上面的說明，我想你應該知道如何去使用這兩個方法了。
7、集合的選用
在HIBERNATE 3.1文檔的“19.5. Understanding Collection performance”中有詳細的說明。
8、事務控制
事務方面對效能有影響的主要包括:事務方式的選用，交易隔離等級以及鎖的選用
a) 事務方式選用:如果不涉及多個交易管理員事務的話，不需要使用JTA，只有JDBC的事務控制就可以。
b) 交易隔離等級:參見標準的SQL交易隔離等級
c) 鎖的選用:悲觀鎖(一般由具體的交易管理員實現)，對於長事務效率低，但安全。樂觀鎖(一般在應用層級實現)，如在HIBERNATE中可以定義VERSION欄位，顯然，如果有多個應用操作資料，且這些應用不是用同一種樂觀鎖機制，則樂觀鎖會失效。因此，針對不同的資料應有不同的策略，同前面許多情況一樣，很多時候我們是在效率與安全/準確性上找一個平衡點，無論如何，最佳化都不是一個純技術的問題，你應該對你的應用和業務特徵有足夠的瞭解。
9、大量操作
即使是使用JDBC，在進行大批資料更新時，BATCH與不使用BATCH有效率上也有很大的差別。我們可以通過設定batch_size來讓其支援大量操作。
舉個例子，要大量刪除某表中的對象，如“delete Account”，打出來的語句，會發現HIBERNATE找出了所有ACCOUNT的ID，再進行刪除，這主要是為了維護二級緩衝，這樣效率肯定高不了，在後續的版本中增加了bulk delete/update，但這也無法解決緩衝的維護問題。也就是說，由於有了二級緩衝的維護問題，HIBERNATE的大量操作效率並不盡如人意!
從前面許多要點可以看出，很多時候我們是在效率與安全/準確性上找一個平衡點，無論如何，最佳化都不是一個純技術的問題，你應該對你的應用和業務特徵有足夠的瞭解，一般的，最佳化方案應在架構設計期就基本確定，否則可能導致沒必要的返工，致使項目延期，而作為架構師和專案經理，還要面對開發人員可能的抱怨，必竟，我們對使用者需求更改的控制力不大，但技術/架構風險是應該在初期意識到並制定好相關的對策。
還有一點要注意，應用程式層的緩衝只是錦上添花，永遠不要把它當救命稻草，應用的根基(資料庫設計，演算法，高效的動作陳述式，恰當API的選擇等)才是最重要的。

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

如何進行HIBERNATE效能調優

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support