mysql複合式索引與欄位順序

來源:互聯網
上載者:User

標籤:時間   第一個   uid   也有   大資料   根據   如何   zha   如何使用   

很多時候,我們在mysql中建立了索引,但是某些查詢還是很慢,根本就沒有使用到索引!一般來說,可能是某些欄位沒有建立索引,或者是複合式索引中欄位的順序與查詢語句中欄位的順序不符。

看下面的例子:
假設有一張訂單表(orders),包含order_id和product_id二個欄位。
一共有31條資料。符合下面語句的資料有5條。執行下面的sql語句:

123 select product_idfrom orderswhere order_id in (123312223132224);

這條語句要mysql去根據order_id進行搜尋,然後返回匹配記錄中的product_id。所以複合式索引應該按照以下的順序建立:

1234567891011121314 create index orderid_productid on orders(order_id, product_id)mysql> explain select product_id from orders where order_id in (123312223132224) \G*************************** 1. row ***************************           id: 1  select_type: SIMPLE        table: orders         type: rangepossible_keys: orderid_productid          key: orderid_productid      key_len: 5          ref: NULL         rows: 5        Extra: Using where; Using index1 row in set (0.00 sec)

可以看到,這個複合式索引被用到了,掃描的範圍也很小,只有5行。如果把複合式索引的順序換成product_id, order_id的話,mysql就會去索引中搜尋 *123 *312 *223 *132 *224,必然會有些慢了。

12345678910111213141516171819 mysql> create index orderid_productid on orders(product_id, order_id);                                                      Query OK, 31 rows affected (0.01 sec)Records: 31  Duplicates: 0  Warnings: 0 mysql> explain select product_id from orders where order_id in (123312223132224) \G *************************** 1. row ***************************            id: 1  select_type: SIMPLE        table: orders         type: indexpossible_keys: NULL          key: orderid_productid      key_len: 10          ref: NULL         rows: 31        Extra: Using where; Using index1 row in set (0.00 sec)

這次索引搜尋的效能顯然不能和上次相比了。rows:31,我的表中一共就31條資料。索引被使用部分的長度:key_len:10,比上一次的key_len:5多了一倍。不知道是這樣在索引裡面尋找速度快,還是直接去全表掃描更快呢?

12345678910111213141516171819 mysql> alter table orders add modify_a char(255default ‘aaa‘;Query OK, 31 rows affected (0.01 sec)Records: 31  Duplicates: 0  Warnings: 0 mysql>mysql>mysql> explain select modify_a from orders where order_id in (123312223132224) \G         *************************** 1. row ***************************           id: 1  select_type: SIMPLE        table: orders         type: ALLpossible_keys: NULL          key: NULL      key_len: NULL          ref: NULL         rows: 31        Extra: Using where1 row in set (0.00 sec)

這樣就不會用到索引了。 剛才是因為select的product_id與where中的order_id都在索引裡面的。


為什麼要建立複合式索引呢?這麼簡單的情況直接建立一個order_id的索引不就行了嗎?果只有一個order_id索引,沒什麼問題,會用到這個索引,然後mysql要去磁碟上的表裡面取到product_id。如果有複合式索引的話,mysql可以完全從索引中取到product_id,速度自然會快。再多說幾句複合式索引的最左優先原則:
複合式索引的第一個欄位必須出現在查詢組句中,這個索引才會被用到。果有一個複合式索引(col_a,col_b,col_c),下面的情況都會用到這個索引:

1234 col_a = "some value";col_a = "some value" and col_b = "some value";col_a = "some value" and col_b = "some value" and col_c = "some value";col_b = "some value" and col_a = "some value" and col_c = "some value";

對於最後一條語句,mysql會自動最佳化成第三條的樣子~~。下面的情況就不會用到索引:

12 col_b = "aaaaaa";col_b = "aaaa" and col_c = "cccccc";

列轉自:http://hi.baidu.com/liuzhiqun/blog/item/4957bcb1aed1b5590823023c.html

通過執行個體理解單列索引、多列索引以及最左首碼原則。執行個體:現在我們想查出滿足以下條件的使用者id:
mysql>SELECT `uid` FROM people WHERE lname`=‘Liu‘  AND `fname`=‘Zhiqun‘ AND `age`=26
因為我們不想掃描整表,故考慮用索引。

單列索引:
ALTER TABLE people ADD INDEX lname (lname);
將lname列建索引,這樣就把範圍限制在lname=‘Liu‘的結果集1上,之後掃描結果集1,產生滿足fname=‘Zhiqun‘的結果集2,再掃描結果集2,找到 age=26的結果集3,即最終結果。

由 於建立了lname列的索引,與執行表的完全掃描相比,效率提高了很多,但我們要求掃描的記錄數量仍舊遠遠超過了實際所需 要的。雖然我們可以刪除lname列上的索引,再建立fname或者age 列的索引,但是,不論在哪個列上建立索引搜尋效率仍舊相似。

2.多列索引:
ALTER TABLE people ADD INDEX lname_fname_age (lame,fname,age);
為了提高搜尋效率,我們需要考慮運用多列索引,由於索引檔案以B-Tree格式儲存,所以我們不用掃描任何記錄,即可得到最終結果。

註:在mysql中執行查詢時,只能使用一個索引,如果我們在lname,fname,age上分別建索引,執行查詢時,只能使用一個索引,mysql會選擇一個最嚴格(獲得結果集記錄數最少)的索引。

3.最左首碼:顧名思義,就是最左優先,上例中我們建立了lname_fname_age多列索引,相當於建立了(lname)單列索引,(lname,fname)複合式索引以及(lname,fname,age)複合式索引。

註:在建立多列索引時,要根據業務需求,where子句中使用最頻繁的一列放在最左邊。

建立索引的時機

到這裡我們已經學會了建立索引,那麼我們需要在什麼情況下建立索引呢?一般來說,在WHERE和JOIN中出現的列需要建立索引,但也不完全如此,因為MySQL只對<,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE才會使用索引。例如:

1 SELECT t.Name FROM mytable t LEFT JOIN mytable m ON t.Name=m.username WHERE m.age=20 AND m.city=‘鄭州‘

此時就需要對city和age建立索引,由於mytable表的userame也出現在了JOIN子句中,也有對它建立索引的必要。

剛才提到只有某些時候的LIKE才需建立索引。因為在以萬用字元%和_開頭作查詢時,MySQL不會使用索引。例如下句會使用索引:

1 SELECT * FROM mytable WHERE username like‘admin%‘

下句就不會使用:

1 SELECT * FROM mytable WHEREt Name like‘%admin‘

因此,在使用LIKE時應注意以上的區別。

索引的不足之處

上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:

  • 雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案。
  • 建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在一個大表上建立了多種複合式索引,索引檔案的會膨脹很快。索引只是提高效率的一個因素,如果你的MySQL有大資料量的表,就需要花時間研究建立最優秀的索引,或最佳化查詢語句。

使用索引的注意事項

使用索引時,有以下一些技巧和注意事項:

  • 索引不會包含有NULL值的列

只要列中包含有NULL值都將不會被包含在索引中,複合索引中只要有一列含有NULL值,那麼這一列對於此複合索引就是無效的。所以我們在資料庫設計時不要讓欄位的預設值為NULL。

  • 使用短索引

對串列進行索引,如果可能應該指定一個前置長度。例如,如果有一個CHAR(255)的列,如果在前10個或20個字元內,多數值是惟一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。

  • 索引列排序

MySQL查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列建立複合索引。

  • like語句操作

一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。

  • 不要在列上進行運算

select * from users where YEAR(adddate)<2007; 

將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成

select * from users where adddate<‘2007-01-01’;  

  • 不使用NOT IN和<>操作
  

mysql複合式索引與欄位順序

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.