假如我們建立了一個testIndex表:
CREATE TABLE testIndex(i_testID INT NOT NULL,vc_Name VARCHAR(16) NOT NULL);
我們隨機向裡面插入了1000條記錄,其中有一條
i_testID vc_Name
555 erquan
在尋找vc_Name="erquan"的記錄
SELECT * FROM testIndex WHERE vc_Name='erquan';
時,如果在vc_Name上已經建立了索引,MySql無須任何掃描,即準確可找到該記錄!相反,MySql會掃描所有記錄,即要查詢1000次啊~~可以索引將查詢速度提高100倍。
一、索引分單列索引和複合式索引
單列索引:即一個索引只包含單個列,一個表可以有多個單列索引,但這不是複合式索引。
複合式索引:即一個索包含多個列。
二、介紹一下索引的類型
1.普通索引。
這是最基本的索引,它沒有任何限制。它有以下幾種建立方式:
(1)建立索引:CREATE INDEX indexName ON tableName(tableColumns(length));如果是CHAR,VARCHAR類型,length可以小於欄位實際長度;如果是BLOB 和 TEXT 類型,必須指定length,下同。
(2)修改表結構:ALTER tableName ADD INDEX [indexName] ON (tableColumns(length))
(3)建立表的時候直接指定:CREATE TABLE tableName ( [...], INDEX [indexName] (tableColumns(length)) ;
2.唯一索引。
它與前面的"普通索引"類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是複合式索引,則列值的組合必須唯一。它有以下幾種建立方式:
(1)建立索引:CREATE UNIQUE INDEX indexName ON tableName(tableColumns(length))
(2)修改表結構:ALTER tableName ADD UNIQUE [indexName] ON (tableColumns(length))
(3)建立表的時候直接指定:CREATE TABLE tableName ( [...], UNIQUE [indexName] (tableColumns(length));
3.主鍵索引
它是一種特殊的唯一索引,不允許有空值。一般是在建表的時候同時建立主鍵索引:CREATE TABLE testIndex(i_testID INT NOT NULL AUTO_INCREMENT,vc_Name VARCHAR(16) NOT NULL,PRIMARY KEY(i_testID)); 當然也可以用ALTER命令。
記住:一個表只能有一個主鍵。
4.全文索引
MySQL從3.23.23版開始支援全文索引和全文檢索索引。這裡不作討論,呵呵~~
刪除索引的文法:DROP INDEX index_name ON tableName
三、單列索引和複合式索引
為了形象地對比兩者,再建一個表:
CREATE TABLE myIndex ( i_testID INT NOT NULL AUTO_INCREMENT, vc_Name VARCHAR(50) NOT NULL, vc_City VARCHAR(50) NOT NULL, i_Age INT NOT NULL, i_SchoolID INT NOT NULL, PRIMARY KEY (i_testID) );
在這10000條記錄裡面7上8下地分布了5條vc_Name="erquan"的記錄,只不過city,age,school的組合各不相同。
來看這條T-SQL:
SELECT i_testID FROM myIndex WHERE vc_Name='erquan' AND vc_City='鄭州' AND i_Age=25;
首先考慮建單列索引:
在vc_Name列上建立了索引。執行T-SQL時,MYSQL很快將目標鎖定在了vc_Name=erquan的5條記錄上,取出來放到一中間結果集。在這個結果集裡,先排除掉vc_City不等於"鄭州"的記錄,再排除i_Age不等於25的記錄,最後篩選出唯一的合格記錄。
雖然在vc_Name上建立了索引,查詢時MYSQL不用掃描整張表,效率有所提高,但離我們的要求還有一定的距離。同樣的,在vc_City和i_Age分別建立的單列索引的效率相似。
為了進一步榨取MySQL的效率,就要考慮建立複合式索引。就是將vc_Name,vc_City,i_Age建到一個索引裡:
ALTER TABLE myIndex ADD INDEX name_city_age (vc_Name(10),vc_City,i_Age);--注意了,建表時,vc_Name長度為50,這裡為什麼用10呢?因為一般情況下名字的長度不會超過10,這樣會加速索引查詢速度,還會減少索引檔案的大小,提高INSERT的更新速度。
執行T-SQL時,MySQL無須掃描任何記錄就到找到唯一的記錄!!
肯定有人要問了,如果分別在vc_Name,vc_City,i_Age上建立單列索引,讓該表有3個單列索引,查詢時和上述的複合式索引效率一樣吧?嘿嘿,大不一樣,遠遠低於我們的複合式索引~~雖然此時有了三個索引,但MySQL只能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的複合式索引,其實是相當於分別建立了
vc_Name,vc_City,i_Age
vc_Name,vc_City
vc_Name
這樣的三個複合式索引!為什麼沒有vc_City,i_Age等這樣的複合式索引呢?這是因為mysql複合式索引"最左首碼"的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這三列的查詢都會用到該複合式索引,下面的幾個T-SQL會用到:
SELECT * FROM myIndex WHREE vc_Name="erquan" AND vc_City="鄭州"
SELECT * FROM myIndex WHREE vc_Name="erquan"
而下面幾個則不會用到:
SELECT * FROM myIndex WHREE i_Age=20 AND vc_City="鄭州"
SELECT * FROM myIndex WHREE vc_City="鄭州"
四、使用索引
到此你應該會建立、使用索引了吧?但什麼情況下需要建立索引呢?一般來說,在WHERE和JOIN中出現的列需要建立索引,但也不完全如此,因為MySQL只對 <,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE(後面有說明)才會使用索引。
SELECT t.vc_Name FROM testIndex t LEFT JOIN myIndex m ON t.vc_Name=m.vc_Name WHERE m.i_Age=20 AND m.vc_City='鄭州' 時,有對myIndex表的vc_City和i_Age建立索引的需要,由於testIndex表的vc_Name開出現在了JOIN子句中,也有對它建立索引的必要。
剛才提到了,只有某些時候的LIKE才需建立索引?是的。因為在以萬用字元 % 和 _ 開頭作查詢時,MySQL不會使用索引,如
SELECT * FROM myIndex WHERE vc_Name like'erquan%'
會使用索引,而
SELECT * FROM myIndex WHEREt vc_Name like'%erquan'
就不會使用索引了。
五、索引的不足之處
上面說了那麼多索引的好話,它真的有像傳說中那麼優秀嗎?當然會有缺點了。
1.雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案
2.建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在一個大表上建立了多種複合式索引,索引檔案的會膨脹很快。
篇尾:
講了這麼多,無非是想利用索引提高資料庫的執行效率。不過索引只是提高效率的一個因素。如果你的MySQL有大資料的表,就需要花時間研究建立最優秀的索引或最佳化查詢語句。