淺談如何構建高效的MySQL分頁

來源:互聯網
上載者:User

PERCONA PERFORMANCE CONFERENCE 2009上,來自雅虎的幾位工程師帶來了一篇”Efficient Pagination Using MySQL“的報告,有很多亮點,本文是在原文基礎上的進一步延伸。

首先看一下分頁的基本原理:

 
  1. mysql> explain SELECT * FROM message ORDER BY id DESC LIMIT 10000, 20\G  
  2. ***************** 1. row **************  
  3. id: 1  
  4. select_type: SIMPLE  
  5. table: message  
  6. type: index 
  7. possible_keys: NULL 
  8. key: PRIMARY 
  9. key_len: 4  
  10. ref: NULL 
  11. rows: 10020  
  12. Extra:  
  13. 1 row in set (0.00 sec) 

limit 10000,20的意思掃描滿足條件的10020行,扔掉前面的10000行,返回最後的20行,問題就在這裡,如果是limit 100000,100,需要掃描100100行,在一個高並發的應用裡,每次查詢需要掃描超過10W行,效能肯定大打折扣。文中還提到limit n效能是沒問題的,因為只掃描n行。

文中提到一種”clue”的做法,給翻頁提供一些”線索”,比如還是SELECT * FROM message ORDER BY id DESC,按id降序分頁,每頁20條,當前是第10頁,當前頁條目id最大的是9527,最小的是9500,如果我們只提供”上一頁”、”下一頁”這樣的跳轉不提供到第N頁的跳轉),那麼在處理”上一頁”的時候SQL語句可以是:

 
  1. SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20; 

處理”下一頁”的時候SQL語句可以是:

 
  1. SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 20; 

不管翻多少頁,每次查詢只掃描20行。

缺點是只能提供”上一頁”、”下一頁”的連結形式,但是我們的產品經理非常喜歡”<上一頁 1 2 3 4 5 6 7 8 9 下一頁>”這樣的連結方式,怎麼辦呢?

如果LIMIT m,n不可避免的話,要最佳化效率,只有儘可能的讓m小一下,我們擴充前面的”clue”做法,還是SELECT * FROM message ORDER BY id DESC,按id降序分頁,每頁20條,當前是第10頁,當前頁條目id最大的是9527,最小的是9500,比如要跳到第8頁,我看的SQL語句可以這樣寫:

 
  1. SELECT * FROM message WHERE id > 9527 ORDER BY id ASC LIMIT 20,20; 

跳轉到第13頁:

 
  1. SELECT * FROM message WHERE id < 9500 ORDER BY id DESC LIMIT 40,20; 

原理還是一樣,記錄住當前頁id的最大值和最小值,計算跳轉頁面和當前頁相對位移,由於頁面相近,這個位移量不會很大,這樣的話m值相對較小,大大減少掃描的行數。其實傳統的limit m,n,相對的位移一直是第一頁,這樣的話越翻到後面,效率越差,而上面給出的方法就沒有這樣的問題。

注意SQL語句裡面的ASC和DESC,如果是ASC取出來的結果,顯示的時候記得倒置一下。

已在60W資料總量的表中測試,效果非常明顯。

相關文章

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.