標籤:索引 讀取 理解 自增 行資料 10個 多個 nes tween
關於MySQL索引的好處,如果正確合理設計並且使用索引的MySQL是一輛蘭博基尼的話,那麼沒有設計和使用索引的MySQL就是一個人力三輪車。對於沒有索引的表,單表查詢可能幾十萬資料就是瓶頸,而通常大型網站單日就可能會產生幾十萬甚至幾百萬的資料,沒有索引查詢會變的非常緩慢。還是以WordPress來說,其多個資料表都會對經常被查詢的欄位添加索引,比如wp_comments表中針對5個欄位設計了BTREE索引。
一個簡單的對比測試
以我去年測試的資料作為一個簡單樣本,20多條資料來源隨機產生200萬條資料,平均每條資料來源都重複大概10萬次,表結構比較簡單,僅包含一個自增ID,一個char類型,一個text類型和一個int類型,單表2G大小,使用MyIASM引擎。開始測試未添加任何索引。
執行下面的SQL語句:
1 |
mysql> SELECT id,FROM_UNIXTIME(time) FROM article WHERE a.title=‘測試標題‘ |
查詢需要的時間非常恐怖的,如果加上聯集查詢和其他一些約束條件,資料庫會瘋狂的消耗記憶體,並且會影響前端程式的執行。這時給title欄位添加一個BTREE索引:
1 |
mysql> ALTER TABLE article ADD INDEX index_article_title ON title(200); |
再次執行上述查詢語句,其對比非常明顯:
MySQL索引的概念
索引是一種特殊的檔案(InnoDB資料表上的索引是資料表空間的一個組成部分),它們包含著對資料表裡所有記錄的引用指標。更通俗的說,資料庫索引好比是一本書前面的目錄,能加快資料庫的查詢速度。上述SQL語句,在沒有索引的情況下,資料庫會遍曆全部200條資料後選擇合格;而有了相應的索引之後,資料庫會直接在索引中尋找合格選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那麼你是希望資料庫按照順序讀取完200萬行資料以後給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(註:一般資料庫預設都會為主鍵產生索引)。
索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照資料存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。
MySQL索引的最佳化
上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案。建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在一個大表上建立了多種複合式索引,索引檔案的會膨脹很快。索引只是提高效率的一個因素,如果你的MySQL有大資料量的表,就需要花時間研究建立最優秀的索引,或最佳化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和最佳化方法。
1. 何時使用叢集索引或非叢集索引?
| 動作描述 |
使用叢集索引 |
使用非叢集索引 |
| 列經常被分組排序 |
使用 |
使用 |
| 返回某範圍內的資料 |
使用 |
不使用 |
| 一個或極少不同值 |
不使用 |
不使用 |
| 小數目的不同值 |
使用 |
不使用 |
| 大數目的不同值 |
不使用 |
使用 |
| 頻繁更新的列 |
不使用 |
使用 |
| 外鍵列 |
使用 |
使用 |
| 主鍵列 |
使用 |
使用 |
| 頻繁修改索引列 |
不使用 |
使用 |
|
事實上,我們可以通過前面叢集索引和非叢集索引的定義的例子來理解上表。如:返回某範圍內的資料一項。比如您的某個表有一個時間列,恰好您把彙總索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部資料時,這個速度就將是很快的,因為您的這本字典本文是按日期進行排序的,聚類索引只需要找到要檢索的所有資料中的開頭和結尾資料即可;而不像非叢集索引,必須先查到目錄中查到每一項資料對應的頁碼,然後再根據頁碼查到具體內容。其實這個具體用法我還不是很理解,只能等待後期的項目開發中慢慢學學了。
2. 索引不會包含有NULL值的列
只要列中包含有NULL值都將不會被包含在索引中,複合索引中只要有一列含有NULL值,那麼這一列對於此複合索引就是無效的。所以我們在資料庫設計時不要讓欄位的預設值為NULL。
3. 使用短索引
對串列進行索引,如果可能應該指定一個前置長度。例如,如果有一個CHAR(255)的列,如果在前10個或20個字元內,多數值是惟一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。
4. 索引列排序
MySQL查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列建立複合索引。
5. like語句操作
一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。
6. 不要在列上進行運算
例如:select * from users where YEAR(adddate)<2007,將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成:select * from users where adddate<’2007-01-01′。關於這一點可以圍觀:一個單引號引發的MYSQL效能損失。
最後總結一下,MySQL只對一下操作符才使用索引:<,<=,=,>,>=,between,in,以及某些時候的like(不以萬用字元%或_開頭的情形)。而理論上每張表裡面最多可建立16個索引,不過除非是資料量真的很多,否則過多的使用索引也不是那麼好玩的,比如我剛才針對text類型的欄位建立索引的時候,系統差點就卡死了。
Mysql 索引-2