InnoDB鎖問題
InnoDB與MyISAM的最大不同有兩點:一是支援事務(TRANSACTION);二是採用了行級鎖。行級鎖與表級鎖本來就有許多不同之處,另外,事務的引入也帶來了一些新問題。下面我們先介紹一點背景知識,然後詳細討論InnoDB的鎖問題。
背景知識
1.事務(Transaction)及其ACID屬性
事務是由一組SQ語句組成的邏輯處理單元,事務具有以下4個屬性,通常簡稱為事務的ACID屬性。
原子性(Atomicity):事務是一個原子操作單元,其對資料的修改,要麼全都執行,要麼全都不執行。
一致性(Consistent):在事務開始和完成時,資料都必須保持一致狀態。這意味著所有相關的資料規則都必須應用於事務的修改,以保持資料的完整性;事務結束時,所有的內部資料結構(如B樹索引或雙向鏈表)也都必須是正確的。
隔離性(Isoation):資料庫系統提供一定的隔離機制,保證事務在不受外部並行作業影響的“獨立”環境執行。這意味著交易處理過程中的中間狀態對外部是不可見的,反之亦然。
持久性(Durabe):事務完成之後,它對於資料的修改是永久性的,即使出現系統故障也能夠保持。
銀行轉帳就是事務的一個典型例子。
2.並發交易處理帶來的問題
相對於串列處理來說,並發交易處理能大大增加資料庫資源的利用率,提高資料庫系統的事務輸送量,從而可以支援更多的使用者。但並發交易處理也會帶來一些問題,主要包括以下幾種情況。
更新丟失(ost Update):當兩個或多個事務選擇同一行,然後基於最初選定的值更新該行時,由於每個事務都不知道其他事務的存在,就會發生丟失更新問題--最後的更新覆蓋了由其他事務所做的更新。例如,兩個編輯人員製作了同一文檔的電子副本。每個編輯人員獨立地更改其副本,然後儲存更改後的副本,這樣就覆蓋了原始文檔。最後儲存其更改副本的編輯人員覆蓋另一個編輯人員所做的更改。如果在一個編輯人員完成並提交事務之前,另一個編輯人員不能訪問同一檔案,則可避免此問題。
髒讀(Dirty Reads):一個事務正在對一條記錄做修改,在這個事務完成並提交前,這條記錄的資料就處於不一致狀態;這時,另一個事務也來讀取同一條記錄,如果不加控制,第二個事務讀取了這些“髒”資料,並據此做進一步的處理,就會產生未提交的資料依賴關係。這種現象被形象地叫做"髒讀"。
不可重複讀取(Non-Repeatabe Reads):一個事務在讀取某些資料後的某個時間,再次讀取以前讀過的資料,卻發現其讀出的資料已經發生了改變、或某些記錄已經被刪除了!這種現象就叫做“不可重複讀取”。
幻讀(Phantom Reads):一個事務按相同的查詢條件重新讀取以前檢索過的資料,卻發現其他事務插入了滿足其查詢條件的新資料,這種現象就稱為“幻讀”。
3.交易隔離等級
在上面講到的並發交易處理帶來的問題中,“更新丟失”通常是應該完全避免的。但防止更新丟失,並不能單靠資料庫事務控制器來解決,需要應用程式對要更新的資料加必要的鎖來解決,因此,防止更新丟失應該是應用的責任。
“髒讀”、“不可重複讀取”和“幻讀”,其實都是資料庫讀一致性問題,必須由資料庫提供一定的事務隔離機制來解決。資料庫實現事務隔離的方式,基本上可分為以下兩種。
一種是在讀取資料前,對其加鎖,阻止其他事務對資料進行修改。
另一種是不用加任何鎖,通過一定機制產生一個資料請求時間點的一致性資料快照(Snapshot),並用這個快照來提供一定層級(語句級或事務級)的一致性讀取。從使用者的角度來看,好象是資料庫可以提供同一資料的多個版本,因此,這種技術叫做資料多版本並發控制(MutiVersion Concurrency Contro,簡稱MVCC或MCC),也經常稱為多版本資料庫。
資料庫的事務隔離越嚴格,並發副作用越小,但付出的代價也就越大,因為事務隔離實質上就是使事務在一定程度上 “序列化”進行,這顯然與“並發”是矛盾的。同時,不同的應用對讀一致性和事務隔離程度的要求也是不同的,比如許多應用對“不可重複讀取”和“幻讀”並不敏感,可能更關心資料並發訪問的能力。
為瞭解決“隔離”與“並發”的矛盾,ISO/ANSI SQ92定義了4個交易隔離等級,每個層級的隔離程度不同,允許出現的副作用也不同,應用可以根據自己的商務邏輯要求,通過選擇不同的隔離等級來平衡 “隔離”與“並發”的矛盾。表20-5很好地概括了這4個隔離等級的特性。
最後要說明的是:各具體資料庫並不一定完全實現了上述4個隔離等級,例如,Oracle只提供Read committed和Serializable兩個標準隔離等級,另外還提供自己定義的Read only隔離等級;SQL Server除支援上述ISO/ANSI SQL92定義的4個隔離等級外,還支援一個叫做“快照”的隔離等級,但嚴格來說它是一個用MVCC實現的Serializable隔離等級。MySQL 支援全部4個隔離等級,但在具體實現時,有一些特點,比如在一些隔離等級下是採用MVCC一致性讀,但某些情況下又不是,這些內容在後面的章節中將會做進 一步介紹。
擷取InnoDB行鎖爭用情況
可以通過檢查InnoDB_row_lock狀態變數來分析系統上的行鎖的爭奪情況:
Java代碼
- mysql> show status like 'innodb_row_lock%';
- +-------------------------------+-------+
- | Variable_name | Value |
- +-------------------------------+-------+
- | InnoDB_row_lock_current_waits | 0 |
- | InnoDB_row_lock_time | 0 |
- | InnoDB_row_lock_time_avg | 0 |
- | InnoDB_row_lock_time_max | 0 |
- | InnoDB_row_lock_waits | 0 |
- +-------------------------------+-------+
- 5 rows in set (0.01 sec)
如果發現鎖爭用比較嚴重,如InnoDB_row_lock_waits和InnoDB_row_lock_time_avg的值比較高,還可以通過設定InnoDB Monitors來進一步觀察發生鎖衝突的表、資料行等,並分析鎖爭用的原因。具體方法如下:
Java代碼
- mysql> CREATE TABLE innodb_monitor(a INT) ENGINE=INNODB;
- Query OK, 0 rows affected (0.14 sec)
然後就可以用下面的語句來進行查看:
Java代碼
- mysql> Show innodb status\G;
- *************************** 1. row ***************************
- Type: InnoDB
- Name:
- Status:
監視器可以通過發出下列語句來停止查看:
Java代碼
- mysql> DROP TABLE innodb_monitor;
- Query OK, 0 rows affected (0.05 sec)
設定監視器後,在SHOW INNODB STATUS的顯示內容中,會有詳細的當前鎖等待的資訊,包括表名、鎖類型、鎖定記錄的情況等,便於進行進一步的分析和問題的確定。開啟監視器以後,預設情況下每15秒會向日誌中記錄監控的內容,如果長時間開啟會導致.err檔案變得非常的巨大,所以使用者在確認問題原因之後,要記得刪除監控表以關閉監視器,或者通過使用“--console”選項來啟動伺服器以關閉寫記錄檔。
InnoDB的行鎖模式及加鎖方法
InnoDB實現了以下兩種類型的行鎖。
共用鎖定(S):允許一個事務去讀一行,阻止其他事務獲得相同資料集的獨佔鎖定。
獨佔鎖定(X):允許獲得獨佔鎖定的事務更新資料,阻止其他事務取得相同資料集的共用讀鎖和排他寫鎖。
另外,為了允許行鎖和表鎖共存,實現多粒度鎖機制,InnoDB還有兩種內部使用的意圖鎖定(Intention Locks),這兩種意圖鎖定都是表鎖。
意圖共用鎖(IS):事務打算給資料行加行共用鎖定,事務在給一個資料行加共用鎖定前必須先取得該表的IS鎖。
意向獨佔鎖定(IX):事務打算給資料行加行獨佔鎖定,事務在給一個資料行加獨佔鎖定前必須先取得該表的IX鎖。
上述鎖模式的相容情況具體如表20-6所示。
如果一個事務請求的鎖模式與當前的鎖相容,InnoDB就將請求的鎖授予該事務;反之,如果兩者不相容,該事務就要等待鎖釋放。
意圖鎖定是InnoDB自動加的,不需使用者幹預。對於UPDATE、DELETE和INSERT語句,InnoDB會自動給涉及資料集加獨佔鎖定(X);對於普通SELECT語句,InnoDB不會加任何鎖;事務可以通過以下語句顯示給記錄集加共用鎖定或獨佔鎖定。
共用鎖定(S):SELECT * FROM table_name WHERE ... LOCK IN SHARE MODE。
獨佔鎖定(X):SELECT * FROM table_name WHERE ... FOR UPDATE。
用SELECT ... IN SHARE MODE獲得共用鎖定,主要用在需要資料依存關係時來確認某行記錄是否存在,並確保沒有人對這個記錄進行UPDATE或者DELETE操作。但是如果當前事務也需要對該記錄進行更新操作,則很有可能造成死結,對於鎖定行記錄後需要進行更新操作的應用,應該使用SELECT... FOR UPDATE方式獲得獨佔鎖定。
在如表20-7所示的例子中,使用了SELECT ... IN SHARE MODE加鎖後再更新記錄,看看會出現什麼情況,其中actor表的actor_id欄位為主鍵。
當使用SELECT...FOR UPDATE加鎖後再更新記錄,出現如表20-8所示的情況。
InnoDB行鎖實現方式
InnoDB行鎖是通過給索引上的索引項目加鎖來實現的,這一點MySQL與Oracle不同,後者是通過在資料區塊中對相應資料行加鎖來實現的。InnoDB這種行鎖實現特點意味著:只有通過索引條件檢索資料,InnoDB才使用行級鎖,否則,InnoDB將使用表鎖!
在實際應用中,要特別注意InnoDB行鎖的這一特性,不然的話,可能導致大量的鎖衝突,從而影響並發效能。下面通過一些實際例子來加以說明。
(1)在不通過索引條件查詢的時候,InnoDB確實使用的是表鎖,而不是行鎖。在如表20-9所示的例子中,開始tab_no_index表沒有索引:Java代碼
- mysql> create table tab_no_index(id int,name varchar(10)) engine=innodb;
- Query OK, 0 rows affected (0.15 sec)
- mysql> insert into tab_no_index values(1,'1'),(2,'2'),(3,'3'),(4,'4');
- Query OK, 4 rows affected (0.00 sec)
- Records: 4 Duplicates: 0 Warnings: 0
表20-9 InnoDB儲存引擎的表在不使用索引時使用表鎖例子
在如表20 -9所示的例子中,看起來session_1隻給一行加了獨佔鎖定,但session_2在請求其他行的獨佔鎖定時,卻出現了鎖等待!原因就是在沒有索引的情況下,InnoDB只能使用表鎖。當我們給其增加一個索引後,InnoDB就只鎖定了合格行,如表20-10所示。
建立tab_with_index表,id欄位有普通索引:Java代碼
- mysql> create table tab_with_index(id int,name varchar(10)) engine=innodb;
- Query OK, 0 rows affected (0.15 sec)
- mysql> alter table tab_with_index add index id(id);
- Query OK, 4 rows affected (0.24 sec)
- Records: 4 Duplicates: 0 Warnings: 0
(2)由於MySQL的行鎖是針對索引加的鎖,不是針對記錄加的鎖,所以雖然是訪問不同行的記錄,但是如果是使用相同的索引鍵,是會出現鎖衝突的。應用設 計的時候要注意這一點。在如表20-11所示的例子中,表tab_with_index的id欄位有索引,name欄位沒有索引
Java代碼
- mysql> alter table tab_with_index drop index name;
- Query OK, 4 rows affected (0.22 sec)
- Records: 4 Duplicates: 0 Warnings: 0
- mysql> insert into tab_with_index values(1,'4');
- Query OK, 1 row affected (0.00 sec)
- mysql> select * from tab_with_index where id = 1;
- +------+------+
- | id | name |
- +------+------+
- | 1 | 1 |
- | 1 | 4 |
- +------+------+
- 2 rows in set (0.00 sec)
(3)當表有多個索引的時候,不同的事務可以使用不同的索引鎖定不同的行,另外,不論是使用主鍵索引、唯一索引或普通索引,InnoDB都會使用行鎖來對資料加鎖。
在如表20-12所示的例子中,表tab_with_index的id欄位有主鍵索引,name欄位有普通索引:
Java代碼
- mysql> alter table tab_with_index add index name(name);
- Query OK, 5 rows affected (0.23 sec)
- Records: 5 Duplicates: 0 Warnings: 0
表20-12 InnoDB儲存引擎的表使用不同索引的阻塞例子
(4)即便在條件中使用了索引欄位,但是否使用索引來檢索資料是由MySQL通過判斷不同執行計畫的代價來決定的,如果MySQL認為全表掃描效率更高,比如對一些很小的表,它就不會使用索引,這種情況下InnoDB將使用表鎖,而不是行鎖。因此,在分析鎖衝突時,別忘了檢查SQL的執行計畫,以確認是否真正使用了索引。關於MySQL在什麼情況下不使用索引的詳細討論,參見本章“索引問題”一節的介紹。
在下面的例子中,檢索值的資料類型與索引欄位不同,雖然MySQL能夠進行資料類型轉換,但卻不會使用索引,從而導致InnoDB使用表鎖。通過用explain檢查兩條SQL的執行計畫,我們可以清楚地看到了這一點。
例子中tab_with_index表的name欄位有索引,但是name欄位是varchar類型的,如果where條件中不是和varchar類型進行比較,則會對name進行類型轉換,而執行的全表掃描。
Java代碼
- mysql> alter table tab_no_index add index name(name);
- Query OK, 4 rows affected (8.06 sec)
- Records: 4 Duplicates: 0 Warnings: 0
- mysql> explain select * from tab_with_index where name = 1 \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: tab_with_index
- type: ALL
- possible_keys: name
- key: NULL
- key_len: NULL
- ref: NULL
- rows: 4
- Extra: Using where
- 1 row in set (0.00 sec)
- mysql> explain select * from tab_with_index where name = '1' \G
- *************************** 1. row ***************************
- id: 1
- select_type: SIMPLE
- table: tab_with_index
- type: ref
- possible_keys: name
- key: name
- key_len: 23
- ref: const
- rows: 1
- Extra: Using where
- 1 row in set (0.00 sec)
間隙鎖(Next-Key鎖)
當我們用範圍條件而不是相等條件檢索資料,並請求共用或獨佔鎖定時,InnoDB會給合格已有資料記錄的 索引項目加鎖;對於索引值在條件範圍內但並不存在的記錄,叫做“間隙(GAP)”,InnoDB也會對這個“間隙”加鎖,這種鎖機制就是所謂的間隙鎖 (Next-Key鎖)。舉例來說,假如emp表中只有101條記錄,其empid的值分別是 1,2,...,100,101,下面的SQL:Select * from emp where empid > 100 for update;是一個範圍條件的檢索,InnoDB不僅會對合格empid值為101的記錄加鎖,也會對empid大於101(這些記錄並不存在)的“間隙”加鎖。InnoDB使用間隙鎖的目的,一方面是為了防止幻讀,以滿足相關隔離等級的要求,對於上面的例子,要是不使 用間隙鎖,如果其他事務插入了empid大於100的任何記錄,那麼本事務如果再次執行上述語句,就會發生幻讀;另外一方面,是為了滿足其恢複和複製的需 要。有關其恢複和複製對鎖機制的影響,以及不同隔離等級下InnoDB使用間隙鎖的情況,在後續的章節中會做進一步介紹。很顯然,在使用範圍條件檢索並鎖定記錄時,InnoDB這種加鎖機制會阻塞符合條件範圍內索引值的並發插入,這往往會造成嚴重的鎖等待。因此,在實際應用開發中,尤其是並發插入比較多的應用,我們要盡量最佳化商務邏輯,盡量使用相等條件來訪問更新資料,避免使用範圍條件。還要特別說明的是,InnoDB除了通過範圍條件加鎖時使用間隙鎖外,如果使用相等條件請求給一個不存在的記錄加鎖,InnoDB也會使用間隙鎖!在如表20-13所示的例子中,假如emp表中只有101條記錄,其empid的值分別是1,2,......,100,101。
恢複和複製的需要,對InnoDB鎖機制的影響MySQL通過BINLOG錄執行成功的INSERT、UPDATE、DELETE等更新資料的SQL語句, 並由此實現MySQL資料庫的恢複和主從複製(可以參見本書“管理篇”的介紹)。MySQL的恢複機制(複製其實就是在Slave Mysql不斷做基於BINLOG的恢複)有以下特點。l 一是MySQL的恢複是SQL語句級的,也就是重新執行BINLOG中的SQL語句。這與Oracle資料庫不同,Oracle是基於資料庫檔案塊的。l 二是MySQL的Binlog是按照事務提交的先後順序記錄的,恢複也是按這個順序進行的。這點也與Oralce不同,Oracle是按照系統更新號 (System Change Number,SCN)來恢複資料的,每個事務開始時,Oracle都會分配一個全域唯一的SCN,SCN的順序與事務開始的時間順序是一致的。從上面兩點可知,MySQL的恢複 機制要求:在一個事務未提交前,其他並發事務不能插入滿足其鎖定條件的任何記錄,也就是不允許出現幻讀,這已經超過了ISO/ANSI SQL92“可重複讀”隔離等級的要求,實際上是要求事務要序列化。這也是許多情況下,InnoDB要用到間隙鎖的原因,比如在用範圍條件更新記錄時,無 論在Read Commited或是Repeatable Read隔離等級下,InnoDB都要使用間隙鎖,但這並不是隔離等級要求的,有關InnoDB在不同隔離等級下加鎖的差異在下一小節還會介紹。另外,對於“insert into target_tab select * from source_tab where ...”和“create table new_tab ...select ... From source_tab where ...(CTAS)”這種SQL語句,使用者並沒有對source_tab做任何更新操作,但MySQL對這種SQL語句做了特別處理。先來看如表20-14的例子。
在上面的例子中,只是簡單地讀 source_tab表的資料,相當於執行一個普通的SELECT語句,用一致性讀就可以了。ORACLE正是這麼做的,它通過MVCC技術實現的多版本 資料來實現一致性讀,不需要給source_tab加任何鎖。我們知道InnoDB也實現了多版本資料,對普通的SELECT一致性讀,也不需要加任何 鎖;但這裡InnoDB卻給source_tab加了共用鎖定,並沒有使用多版本資料一致性讀技術!