mysql最佳化實戰(explain && 索引),mysql實戰explain
實驗環境:
1、sql工具:Navicat2、sql資料庫,使用openstack資料庫作為樣本 |
一、mysql索引查詢
show index from instances |
結果欄位解釋:
Table:資料庫表名Non_unique:索引不能包括重複詞,則為0。可以,則為1。Key_name:索引的名稱。 索引中的列序號,從1開始。列名稱列以什麼方式儲存在索引中。在MySQL中,有值‘A’(升序)或NULL(無分類)。索引中唯一值的數目的估計值。通過運行ANALYZE TABLE或myisamchk -a可以更新。基數根據被儲存為整數的統計資料來計數,所以即使對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,MySQL使用該索引的機 會就越大。如果列只是被部分地編入索引,則為被編入索引的字元的數目。如果整列被編入索引,則為NULL。指示關鍵字如何被壓縮。如果沒有被壓縮,則為NULL。如果列含有NULL,則為YES。如果沒有,則該列為NO。用過的索引方法(BTREE, FULLTEXT, HASH, RTREE)。Comment:注釋。
|
二、驗證Mysql的主鍵會自動建立索引?建立一個沒有主鍵的ttx_index資料庫表:查詢索引:結果顯示沒有索引。
改變ttx_index資料庫表欄位id,將之設為主鍵,重新查詢索引:
得出結論,在Mysql中,資料庫主鍵會自動建立索引。
三、Mysql效能最佳化利器:explain1、首先查看instances資料庫表的索引:
2、EXPLAIN 用法詳解:
EXPLAIN SELECT * FROM instances |
根據上述結果,可以此查詢花了0.027ms,沒有可用的索引。
explain欄位詳解:
table:顯示這一行的資料是關於哪張表的 type:這是重要的列,顯示串連使用了何種類型。從最好到最差的連線類型為const、eq_reg、ref、range、indexhe和ALL possible_keys:顯示可能應用在這張表中的索引。如果為空白,沒有可能的索引。可以為相關的域從WHERE語句中選擇一個合適的語句 key: 實際使用的索引。如果為NULL,則沒有使用索引。很少的情況下,MYSQL會選擇最佳化不足的索引。這種情況下,可以在SELECT語句中使用USE INDEX(indexname)來強制使用一個索引或者用IGNORE INDEX(indexname)來強制MYSQL忽略索引 key_len:使用的索引的長度。在不損失精確性的情況下,長度越短越好 ref:顯示索引的哪一列被使用了,如果可能的話,是一個常數 rows:MYSQL認為必須檢查的用來返回請求資料的行數 Extra:關於MYSQL如何解析查詢的額外資訊。將在下表中討論,但這裡可以看到的壞的例子是Using temporary和Using filesort,意思MYSQL根本不能使用索引,結果是檢索會很慢
extra列返回的描述的意義:
Distinct:一旦MYSQL找到了與行相聯合匹配的行,就不再搜尋了 Not exists: MYSQL最佳化了LEFT JOIN,一旦它找到了匹配LEFT JOIN標準的行,就不再搜尋了 Range checked for each Record(index map:#):沒有找到理想的索引,因此對於從前面表中來的每一個行組合,MYSQL檢查使用哪個索引,並用它來從表中返回行。這是使用索引的最慢的串連之一 Using filesort: 看到這個的時候,查詢就需要最佳化了。MYSQL需要進行額外的步驟來發現如何對返回的行排序。它根據連線類型以及儲存排序鍵值和匹配條件的全部行的行指標來排序全部行 Using index: 列資料是從僅僅使用了索引中的資訊而沒有讀取實際的行動的表返回的,這發生在對錶的全部的請求列都是同一個索引的部分的時候 Using temporary 看到這個的時候,查詢需要最佳化了。這裡,MYSQL需要建立一個暫存資料表來儲存結果,這通常發生在對不同的列集進行ORDER BY上,而不是GROUP BY上 Where used 使用了WHERE從句來限制哪些行將與下一張表匹配或者是返回給使用者。如果不想返回表中的全部行,並且連線類型ALL或index,這就會發生,或者是查詢有問題不同連線類型的解釋(按照效率高低的順序排序) system 表只有一行:system表。這是const連線類型的特殊情況 const:表中的一個記錄的最大值能夠匹配這個查詢(索引可以是主鍵或惟一索引)。因為只有一行,這個值實際就是常數,因為MYSQL先讀這個值然後把它當做常數來對待 eq_ref:在串連中,MYSQL在查詢時,從前面的表中,對每一個記錄的聯合都從表中讀取一個記錄,它在查詢使用了索引為主鍵或惟一鍵的全部時使用 ref:這個連線類型只有在查詢使用了不是惟一或主鍵的鍵或者是這些類型的部分(比如,利用最左邊首碼)時發生。對於之前的表的每一個行聯合,全部記錄都將從表中讀出。這個類型嚴重依賴於根據索引匹配的記錄多少—越少越好 range:這個連線類型使用索引返回一個範圍中的行,比如使用>或<尋找東西時發生的情況 index: 這個連線類型對前面的表中的每一個記錄聯合進行完全掃描(比ALL更好,因為索引一般小於表資料) ALL:這個連線類型對於前面的每一個記錄聯合進行完全掃描,這一般比較糟糕,應該盡量避免
|
|
那麼如何才能讓sql走索引查詢呢?
EXPLAIN SELECT * FROM instances WHERE id=1 |
從可以,該sql語句走了索引。因為該表中id為主鍵,mysql會自動建立索引,因此當將id作為where條件查詢時,資料庫會自動走索引。
接下來實驗,當不走索引還是查詢id=1這條資料時候,會是如何?
SELECT id, display_name FROM instances WHERE id=1 |
EXPLAIN SELECT * FROM instances WHERE display_name = "vm1" |
結論:在查詢時候,如果where條件中的欄位有索引(走不走索引,取決於where條件中的欄位),在執行sql語句時,mysql會自動走索引。
但是有個問題是,在走不走索引,查詢花費時間都是0.001ms,似乎沒有得到效能提高?
SELECT COUNT(*) FROM instances |
在資料庫表中instance資料總條數才74條,因此索引沒法發揮它的效能優勢,接下來人為製造上w條資料:
insert instances(display_name) select display_name from instances |
註:上述語句,可用來為資料庫表指數形式插入新資料。
重新查詢總條數:
SELECT COUNT(*) FROM instances |
這次資料已經有接近500w了。再次驗證上述索引效能問題:
1、為了對比的真實性,將id=1的資料記錄的display_name修改為唯一名字test_index_dispaly_name
SELECT id, display_name FROM instances WHERE id=1 |
2、不走索引查詢:
SELECT * FROM instances WHERE display_name = 'test_index_dispaly_name' |
3、通過id走索引查詢:
SELECT * FROM instances WHERE id=1 |
結論:對於百萬上億級資料,走不走索引效率影響相當明顯(效率差別都到萬了)。
4、哪些情況sql不會走索引?
時間關係,此處暫且未總結,後續有時間補上。若有需要請自行網上尋找。 |