MySQL的20條基本最佳化 加參考資料

來源:互聯網
上載者:User

標籤:

mysql的效能最佳化包羅甚廣:
索引最佳化,查詢最佳化,查詢快取,伺服器設定最佳化,作業系統和硬體最佳化,應用程式層面最佳化(web伺服器,緩衝)等等。這裡的記錄的最佳化技巧更適用於開發人員,都是從網路上收集和自己整理的,主要是查詢語句上面的最佳化,其它層面的最佳化技巧在此不做記錄。
查詢的開銷指標:
執行時間
檢查的行數
返回的行數
建立索引的幾個準則:
1、合理的建立索引能夠加速資料讀取效率,不合理的建立索引反而會拖慢資料庫的響應速度。
2、索引越多,更新資料的速度越慢。
3、盡量在採用MyIsam作為引擎的時候使用索引(因為MySQL以BTree儲存索引),而不是InnoDB。但MyISAM不支援Transcation。
4、當你的程式和資料庫結構/SQL語句已經最佳化到無法最佳化的程度,而程式瓶頸並不能順利解決,那就是應該考慮使用諸如memcached這樣的分布式緩衝系統的時候了。
5、習慣和強迫自己用EXPLAIN來分析你SQL語句的效能。
1. count的最佳化
比如:計算id大於5的城市

1 a. select count(*) from world.city where id > 5;2 b. select (select count(*) from world.city) – count(*) from world.city where id <= 5;


a語句當行數超過11行的時候需要掃描的行數比b語句要多, b語句掃描了6行,此種情況下,b語句比a語句更有效率。當沒有where語句的時候直接

select count(*) from world.city

這樣會更快,因為mysql總是知道表的行數。
2. 避免使用不相容的資料類型。
例如float和int、char和varchar、binary和varbinary是不相容的。資料類型的不相容可能使最佳化器無法執行一些本來可以進行的最佳化操作。
在程式中,保證在實現功能的基礎上,盡量減少對資料庫的訪問次數;通過搜尋參數,盡量減少對錶的訪問行數,最小化結果集,從而減輕網路負擔;能夠分開的操作盡量分開處理,提高每次的響應速度;在資料視窗使用SQL時,盡量把使用的索引放在選擇的首列;演算法的結構盡量簡單;在查詢時,不要過多地使用萬用字元如 SELECT * FROM T1語句,要用到幾列就選擇幾列如:SELECT COL1,COL2 FROM T1;在可能的情況下盡量限制盡量結果集行數如:SELECT TOP 300 COL1,COL2,COL3 FROM T1,因為某些情況下使用者是不需要那麼多的資料的。不要在應用中使用資料庫遊標,遊標是非常有用的工具,但比使用常規的、面向集的SQL語句需要更大的開銷;按照特定順序提取資料的尋找。
3. 索引欄位上進行運算會使索引失效。
盡量避免在WHERE子句中對欄位進行函數或運算式操作,這將導致引擎放棄使用索引而進行全表掃描。如:

SELECT * FROM T1 WHERE F1/2=100 應改為: SELECT * FROM T1 WHERE F1=100*2


4. 避免使用!=或<>、IS NULL或IS NOT NULL、IN ,NOT IN等這樣的操作符.
因為這會使系統無法使用索引,而只能直接搜尋表中的資料。例如: SELECT id FROM employee WHERE id != “B%” 最佳化器將無法通過索引來確定將要命中的行數,因此需要搜尋該表的所有行。在in語句中能用exists語句代替的就用exists.
5. 盡量使用數字型欄位.
一部分開發人員和資料庫管理員喜歡把包含數值資訊的欄位
設計為字元型,這會降低查詢和串連的效能,並會增加儲存開銷。這是因為引擎在處理查詢和串連回逐個比較字串中每一個字元,而對於數字型而言只需要比較一次就夠了。
6. 合理使用EXISTS,NOT EXISTS子句。如下所示:

1.SELECT SUM(T1.C1) FROM T1 WHERE (SELECT COUNT(*)FROM T2 WHERE T2.C2=T1.C2>0)2.SELECT SUM(T1.C1) FROM T1WHERE EXISTS(SELECT * FROM T2 WHERE T2.C2=T1.C2)


兩者產生相同的結果,但是後者的效率顯然要高於前者。因為後者不會產生大量鎖定的表掃描或是索引掃描。如果你想校正表裡是否存在某條紀錄,不要用count(*)那樣效率很低,而且浪費伺服器資源。可以用EXISTS代替。如:

IF (SELECT COUNT(*) FROM table_name WHERE column_name = ‘xxx’)

可以寫成:

IF EXISTS (SELECT * FROM table_name WHERE column_name = ‘xxx’)


7. 能夠用BETWEEN的就不要用IN
8. 能夠用DISTINCT的就不用GROUP BY
9. 盡量不要用SELECT INTO語句。SELECT INTO 語句會導致表鎖定,阻止其他使用者訪問該表。
10. 必要時強制查詢最佳化工具使用某個索引

SELECT * FROM T1 WHERE nextprocess = 1 AND processid IN (8,32,45) 改成:SELECT * FROM T1 (INDEX = IX_ProcessID) WHERE nextprocess = 1 AND processid IN (8,32,45)


則查詢最佳化工具將會強行利用索引IX_ProcessID 執行查詢。
11. 消除對大型表行資料的順序存取
儘管在所有的檢查列上都有索引,但某些形式的WHERE子句強迫最佳化器使用順序存取。如:

SELECT * FROM orders WHERE (customer_num=104 AND order_num>1001) OR order_num=1008


解決辦法可以使用並集來避免順序存取:

SELECT * FROM orders WHERE customer_num=104 AND order_num>1001 UNION SELECT * FROM orders WHERE order_num=1008


這樣就能利用索引路徑處理查詢。【jacking 資料結果集很多,但查詢條件限定後結果集不大的情況下,後面的語句快】
12. 盡量避免在索引過的字元資料中,使用非打頭字母搜尋。這也使得引擎無法利用索引。
見如下例子:

SELECT * FROM T1 WHERE NAME LIKE ‘%L%’SELECT * FROM T1 WHERE SUBSTING(NAME,2,1)=’L’SELECT * FROM T1 WHERE NAME LIKE ‘L%’

 


即使NAME欄位建有索引,前兩個查詢依然無法利用索引完成加快操作,引擎不得不對全表所有資料逐條操作來完成任務。而第三個查詢能夠使用索引來加快操作,不要習慣性的使用 ‘%L%’這種方式(會導致全表掃描),如果可以使用`L%’相對來說更好;
13. 雖然UPDATE、DELETE語句的寫法基本固定,但是還是對UPDATE語句給點建議:

a) 盡量不要修改主鍵欄位。b) 當修改VARCHAR型欄位時,盡量使用相同長度內容的值代替。c) 盡量最小化對於含有UPDATE觸發器的表的UPDATE操作。d) 避免UPDATE將要複製到其他資料庫的列。e) 避免UPDATE建有很多索引的列。f) 避免UPDATE在WHERE子句條件中的列。

14. 能用UNION ALL就不要用UNION
UNION ALL不執行SELECT DISTINCT函數,這樣就會減少很多不必要的資源
在跨多個不同的資料庫時使用UNION是一個有趣的最佳化方法,UNION從兩個互不關聯的表中返回資料,這就意味著不會出現重複的行,同時也必須對資料進行排序,我們知道排序是非常耗費資源的,特別是對大表的排序。
UNION ALL可以大大加快速度,如果你已經知道你的資料不會包括重複行,或者你不在乎是否會出現重複的行,在這兩種情況下使用UNION ALL更適合。此外,還可以在應用程式邏輯中採用某些方法避免出現重複的行,這樣UNION ALL和UNION返回的結果都是一樣的,但UNION ALL不會進行排序。
15. 欄位資料類型最佳化:
a. 避免使用NULL類型:NULL對於大多數資料庫都需要特殊處理,MySQL也不例外,它需要更多的代碼,更多的檢查和特殊的索引邏輯,有些開發人員完全沒有意識到,建立表時NULL是預設值,但大多數時候應該使用NOT NULL,或者使用一個特殊的值,如0,-1作為預設值。
b. 儘可能使用更小的欄位,MySQL從磁碟讀取資料後是儲存到記憶體中的,然後使用cpu周期和磁碟I/O讀取它,這意味著越小的資料類型佔用的空間越小,從磁碟讀或打包到記憶體的效率都更好,但也不要太過執著減小資料類型,要是以後應用程式發生什麼變化就沒有空間了。修改表將需要重構,間接地可能引起代碼的改變,這是很頭疼的問題,因此需要找到一個平衡點。
c. 優先使用定長型
16. 關於大資料量limit分布的最佳化見下面連結(當位移量特別大時,limit效率會非常低):
http://ariyue.iteye.com/blog/553541
附上一個提高limit效率的簡單技巧,在覆蓋索引(覆蓋索引用通俗的話講就是在select的時候只用去讀取索引而取得資料,無需進行二次select相關表)上進行位移,而不是對全行資料進行位移。可以將從覆蓋索引上提取出來的資料和全行資料進行聯結,然後取得需要的列,會更有效率,看看下面的查詢:
mysql> select film_id, description from sakila.film order by title limit 50, 5;
如果表非常大,這個查詢最好寫成下面的樣子:

mysql> select film.film_id, film.description from sakila.filminner join(select film_id from sakila.film order by title liimit 50,5) as film usinig(film_id);

 


17. 程式中如果一次性對同一個表插入多條資料,比如以下語句:

insert into person(name,age) values(‘xboy’, 14);insert into person(name,age) values(‘xgirl’, 15);insert into person(name,age) values(‘nia’, 19);

 


把它拼成一條語句執行效率會更高.

insert into person(name,age) values(‘xboy’, 14), (‘xgirl’, 15),(‘nia’, 19);

 


18. 不要在選擇的欄位上放置索引,這是無意義的。應該在條件選擇的語句上合理的放置索引,比如where,order by。

SELECT id,title,content,cat_id FROM article WHERE cat_id = 1;

 


上面這個語句,你在id/title/content上放置索引是毫無意義的,對這個語句沒有任何最佳化作用。但是如果你在外鍵cat_id上放置一個索引,那作用就相當大了。
19. ORDER BY語句的MySQL最佳化:
a. ORDER BY + LIMIT組合的索引最佳化。如果一個SQL語句形如:

SELECT [column1],[column2],…. FROM [TABLE] ORDER BY [sort] LIMIT [offset],[LIMIT];

 


這個SQL語句最佳化比較簡單,在[sort]這個欄位上建立索引即可。
b. WHERE + ORDER BY + LIMIT組合的索引最佳化,形如:

SELECT [column1],[column2],…. FROM [TABLE] WHERE [columnX] = [VALUE] ORDER BY [sort] LIMIT [offset],[LIMIT];

 


這個語句,如果你仍然採用第一個例子中建立索引的方法,雖然可以用到索引,但是效率不高。更高效的方法是建立一個聯合索引(columnX,sort)
c. WHERE + IN + ORDER BY + LIMIT組合的索引最佳化,形如:

SELECT [column1],[column2],…. FROM [TABLE] WHERE [columnX] IN ([value1],[value2],…) ORDER BY [sort] LIMIT [offset],[LIMIT];

 


這個語句如果你採用第二個例子中建立索引的方法,會得不到預期的效果(僅在[sort]上是using index,WHERE那裡是using where;using filesort),理由是這裡對應columnX的值對應多個。
目前哥還木有找到比較優秀的辦法,等待高手指教。
d.WHERE+ORDER BY多個欄位+LIMIT,比如:
SELECT * FROM [table] WHERE uid=1 ORDER x,y LIMIT 0,10;
對於這個語句,大家可能是加一個這樣的索引:(x,y,uid)。但實際上更好的效果是(uid,x,y)。這是由MySQL處理排序的機製造成的。
20. 其它技巧:
http://www.cnblogs.com/nokiaguy/archive/2008/05/24/1206469.html
http://www.cnblogs.com/suchshow/archive/2011/12/15/2289182.html
http://www.cnblogs.com/cy163/archive/2009/05/28/1491473.html
http://www.cnblogs.com/younggun/articles/1719943.html
http://wenku.baidu.com/view/f57c7041be1e650e52ea9985.html
最後,你可以使用explain關鍵字去判斷和評測一個sql語句是否還有最佳化的可能性,關於它的詳細使用請參考mysql手冊

MySQL的20條基本最佳化 加參考資料

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.