一,索引基礎用法
1. 建立索引
在執行CREATE TABLE語句時可以建立索引,也可以單獨用CREATE INDEX或ALTER TABLE來為表增加索引。
1>ALTER TABLE
ALTER TABLE用來建立普通索引、UNIQUE索引或PRIMARY KEY索引。
ALTER TABLE table_name ADD INDEX index_name (column_list)
ALTER TABLE table_name ADD UNIQUE (column_list)
ALTER TABLE table_name ADD PRIMARY KEY (column_list)
其中table_name是要增加索引的表名,column_list指出對哪些列進行索引,多列時各列之間用逗號分隔。索引名index_name可選,預設時,MySQL將根據第一個索引列賦一個名稱。另外,ALTER TABLE允許在單個語句中更改多個表,因此可以在同時建立多個索引。
2>CREATE INDEX
CREATE INDEX可對錶增加普通索引或UNIQUE索引。
CREATE INDEX index_name ON table_name (column_list)
CREATE UNIQUE INDEX index_name ON table_name (column_list)
table_name、index_name和column_list具有與ALTER TABLE語句中相同的含義,索引名不可選。另外,不能用CREATE INDEX語句建立PRIMARY KEY索引。
2. 刪除索引
可利用ALTER TABLE或DROP INDEX語句來刪除索引。類似於CREATE INDEX語句,DROP INDEX可以在ALTER TABLE內部作為一條語句處理,文法如下。
DROP INDEX index_name ON talbe_name
ALTER TABLE table_name DROP INDEX index_name
ALTER TABLE table_name DROP PRIMARY KEY
其中,前兩條語句是等價的,刪除掉table_name中的索引index_name。第3條語句只在刪除PRIMARY KEY索引時使用,因為一個表只可能有一個PRIMARY KEY索引,因此不需要指定索引名。如果沒有建立PRIMARY KEY索引,但表具有一個或多個UNIQUE索引,則MySQL將刪除第一個UNIQUE索引。如果從表中刪除了某列,則索引會受到影響。對於多列組合的索引,如果刪除其中的某列,則該列也會從索引中刪除。如果刪除群組成索引的所有列,則整個索引將被刪除。
註:使用 刪除主鍵索引 mysql> alter table t_user drop primary key;
出現如下錯誤 ERROR 1075 (42000): Incorrect table definition; there can be only one auto column and it must be defined as a key
原因:表中主鍵欄位為自動成長導致失敗,去除自增長即可。
3.查看索引
mysql> show index from tblname;
mysql> show keys from tblname;
參數說明:
· Table
表的名稱。
· Non_unique
如果索引不能包括重複詞,則為0。如果可以,則為1。
· Key_name
索引的名稱。
· Seq_in_index
索引中的列序號,從1開始。
· Column_name
列名稱。
· Collation
列以什麼方式儲存在索引中。在MySQL中,有值‘A’(升序)或NULL(無分類)。
· Cardinality
索引中唯一值的數目的估計值。通過運行ANALYZE TABLE或myisamchk -a可以更新。基數根據被儲存為整數的統計資料來計數,
所以即使對於小型表,該值也沒有必要是精確的。基數越大,當進行聯合時,MySQL使用該索引的機會就越大。
· Sub_part
如果列只是被部分地編入索引,則為被編入索引的字元的數目。如果整列被編入索引,則為NULL。
· Packed
指示關鍵字如何被壓縮。如果沒有被壓縮,則為NULL。
· Null
如果列含有NULL,則含有YES。如果沒有,則該列含有NO。
· Index_type
用過的索引方法(BTREE, FULLTEXT, HASH, RTREE)。
· Comment
備忘資訊
二,索引效能最佳化
就是這麼一個結構極其簡單的表,200萬數量級的複雜查詢將會變的非常緩慢,比如執行下面的SQL語句。
SELECT a.id,FROM_UNIXTIME(a.time)
FROM article AS a
WHERE a.title=‘PHP筆試題和答案——基礎語言方面’
查詢時間基本上需要50-100秒,這個是非常恐怖的,如果加上聯集查詢和其他一些約束條件,資料庫會瘋狂的消耗記憶體。
如果這時候資料庫裡面針對title欄位建立了索引,查詢效率將會大幅度提升,如下圖所示。可見對於大型資料庫,建立索引是非常非常重要的一個最佳化手段(當然還會有很多其他最佳化這樣的資料庫的方法,但是本文主題所限,暫不討論。),廢話了這麼多,以下開始總結MySQL中索引的使用方法和效能最佳化以及一些注意事項。
索引的概念
索引是一種特殊的檔案(InnoDB資料表上的索引是資料表空間的一個組成部分),它們包含著對資料表裡所有記錄的引用指標。更通俗的說,資料庫索引好比是一本書前面的目錄,能加快資料庫的查詢速度。上述SQL語句,在沒有索引的情況下,資料庫會遍曆全部200條資料後選擇合格;而有了相應的索引之後,資料庫會直接在索引中尋找合格選項。如果我們把SQL語句換成“SELECT * FROM article WHERE id=2000000”,那麼你是希望資料庫按照順序讀取完200萬行資料以後給你結果還是直接在索引中定位呢?上面的兩個圖片鮮明的用時對比已經給出了答案(註:一般資料庫預設都會為主鍵產生索引)。
索引分為聚簇索引和非聚簇索引兩種,聚簇索引是按照資料存放的物理位置為順序的,而非聚簇索引就不一樣了;聚簇索引能提高多行檢索的速度,而非聚簇索引對於單行的檢索很快。
索引的類型
1. 普通索引
這是最基本的索引,它沒有任何限制,比如上文中為title欄位建立的索引就是一個普通索引。
–直接建立索引
CREATE INDEX indexName ON table(column(length))
–修改表結構的方式添加索引
ALTER tableADD INDEX indexName ON (column(length))
–建立表的時候同時建立索引
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,
`time` int(10) NULL DEFAULT NULL ,
PRIMARY KEY (`id`),
INDEX indexName (title(length))
)
–刪除索引
DROP INDEX indexName ON table
2. 唯一索引
與普通索引類似,不同的就是:索引列的值必須唯一,但允許有空值(注意和主鍵不同)。如果是複合式索引,則列值的組合必須唯一,建立方法和普通索引類似。
–建立唯一索引
CREATE UNIQUE INDEX indexName ON table(column(length))
–修改表結構
ALTER table ADD UNIQUE indexName ON (column(length))
–建立表的時候直接指定
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,
`time` int(10) NULL DEFAULT NULL ,
PRIMARY KEY (`id`),
UNIQUE indexName (title(length))
);
3. 全文索引(FULLTEXT)
MySQL從3.23.23版開始支援全文索引和全文檢索索引,FULLTEXT索引僅可用於 MyISAM 表;他們可以從CHAR、VARCHAR或TEXT列中作為CREATE TABLE語句的一部分被建立,或是隨後使用ALTER TABLE 或CREATE INDEX被添加。////對於較大的資料集,將你的資料輸入一個沒有FULLTEXT索引的表中,然後建立索引,其速度比把資料輸入現有FULLTEXT索引的速度更為快。不過切記對於大容量的資料表,產生全文索引是一個非常消耗時間非常消耗硬碟空間的做法。
–建立表的適合添加全文索引
CREATE TABLE `table` (
`id` int(11) NOT NULL AUTO_INCREMENT ,
`title` char(255) CHARACTER SET utf8 COLLATE utf8_general_ci NOT NULL ,
`content` text CHARACTER SET utf8 COLLATE utf8_general_ci NULL ,
`time` int(10) NULL DEFAULT NULL ,
PRIMARY KEY (`id`),
FULLTEXT (content)
);
–修改表結構添加全文索引
ALTER TABLE article ADD FULLTEXT index_content(content)
–直接建立索引
CREATE FULLTEXT INDEX index_content ON article(content)
4. 單列索引、多列索引
多個單列索引與單個多列索引的查詢效果不同,因為執行查詢時,MySQL只能使用一個索引,會從多個索引中選擇一個限制最為嚴格的索引。
5. 複合式索引(最左首碼)
平時用的SQL查詢語句一般都有比較多的限制條件,所以為了進一步榨取MySQL的效率,就要考慮建立複合式索引。例如上表中針對title和time建立一個複合式索引:ALTER TABLE article ADD INDEX index_titme_time (title(50),time(10))。建立這樣的複合式索引,其實是相當於分別建立了下面兩組複合式索引:
–title,time
–title
為什麼沒有time這樣的複合式索引呢?這是因為MySQL複合式索引“最左首碼”的結果。簡單的理解就是只從最左面的開始組合。並不是只要包含這兩列的查詢都會用到該複合式索引,如下面的幾個SQL所示:
–使用到上面的索引
SELECT * FROM article WHREE title=“LED日光管” AND time=1234567890
SELECT * FROM article WHREE utitle=“LED日光管”
–不使用上面的索引
SELECT * FROM article WHREE time=1234567890
MySQL索引的最佳化
上面都在說使用索引的好處,但過多的使用索引將會造成濫用。因此索引也會有它的缺點:雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對錶進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要儲存資料,還要儲存一下索引檔案。建立索引會佔用磁碟空間的索引檔案。一般情況這個問題不太嚴重,但如果你在一個大表上建立了多種複合式索引,索引檔案的會膨脹很快。索引只是提高效率的一個因素,如果你的MySQL有大資料量的表,就需要花時間研究建立最優秀的索引,或最佳化查詢語句。下面是一些總結以及收藏的MySQL索引的注意事項和最佳化方法。
1. 何時使用叢集索引或非叢集索引?
動作描述 使用叢集索引 使用非叢集索引
列經常被分組排序 使用 使用
返回某範圍內的資料 使用 不使用
一個或極少不同值 不使用 不使用
小數目的不同值 使用 不使用
大數目的不同值 不使用 使用
頻繁更新的列 不使用 使用
外鍵列 使用 使用
主鍵列 使用 使用
頻繁修改索引列 不使用 使用
事實上,我們可以通過前面叢集索引和非叢集索引的定義的例子來理解上表。如:返回某範圍內的資料一項。比如您的某個表有一個時間列,恰好您把彙總索引建立在了該列,這時您查詢2004年1月1日至2004年10月1日之間的全部資料時,這個速度就將是很快的,因為您的這本字典本文是按日期進行排序的,聚類索引只需要找到要檢索的所有資料中的開頭和結尾資料即可;而不像非叢集索引,必須先查到目錄中查到每一項資料對應的頁碼,然後再根據頁碼查到具體內容。其實這個具體用法我還不是很理解,只能等待後期的項目開發中慢慢學學了。
2. 索引不會包含有NULL值的列
只要列中包含有NULL值都將不會被包含在索引中,複合索引中只要有一列含有NULL值,那麼這一列對於此複合索引就是無效的。所以我們在資料庫設計時不要讓欄位的預設值為NULL。
3. 使用短索引
對串列進行索引,如果可能應該指定一個前置長度。例如,如果有一個CHAR(255)的列,如果在前10個或20個字元內,多數值是惟一的,那麼就不要對整個列進行索引。短索引不僅可以提高查詢速度而且可以節省磁碟空間和I/O操作。
4. 索引列排序
MySQL查詢只使用一個索引,因此如果where子句中已經使用了索引的話,那麼order by中的列是不會使用索引的。因此資料庫預設排序可以符合要求的情況下不要使用排序操作;盡量不要包含多個列的排序,如果需要最好給這些列建立複合索引。
5. like語句操作
一般情況下不鼓勵使用like操作,如果非使用不可,如何使用也是一個問題。like “%aaa%” 不會使用索引而like “aaa%”可以使用索引。
6. 不要在列上進行運算
例如:select * from users where YEAR(adddate)<2007,將在每個行上進行運算,這將導致索引失效而進行全表掃描,因此我們可以改成:select * from users where adddate<’2007-01-01′。關於這一點可以圍觀:一個單引號引發的MYSQL效能損失。
最後總結一下,MySQL只對一下操作符才使用索引:<,<=,=,>,>=,between,in,以及某些時候的like(不以萬用字元%或_開頭的情形)。而理論上每張表裡面最多可建立16個索引,不過除非是資料量真的很多,否則過多的使用索引也不是那麼好玩的,比如我剛才針對text類型的欄位建立索引的時候,系統差點就卡死了。