引自:http://www.oecp.cn/hi/zhaolihong/blog/1980最近在項目中使用SqlServer的時候發現在高並發情況下,頻繁更新和頻繁查詢引發死結。通常我們知道如果兩個事務同時對一個表進行插入或修改資料,會發生在請求對錶的X鎖時,已經被對方持有了。由於得不到鎖,後面的Commit無法執行,這樣雙方開始死結。但是select語句和update語句同時執行,怎麼會發生死結呢?看完下面的分析,你會明白的……
首先舉個例子:
CREATE PROC p1 @p1 int AS
SELECT c2, c3 FROM t1 WHERE c2 BETWEEN @p1
AND @p1+1
GO
CREATE PROC p2 @p1 int AS
UPDATE t1 SET
c2 = c2+1 WHERE c1 = @p1
UPDATE t1 SET c2 = c2-1 WHERE c1 =
@p1
GO
p1沒有insert,沒有delete,沒有update,只是一個select,p2才是update。
那麼,什麼導致了死結?
需要從事件記錄中,看sql的死結資訊:
Spid X is running this query (line 2 of proc
[p1], inputbuffer “… EXEC p1 4 …”):
SELECT c2, c3 FROM t1 WHERE c2 BETWEEN
@p1 AND @p1+1
Spid Y is running this query (line 2 of proc [p2],
inputbuffer “EXEC p2 4”):
UPDATE t1 SET c2 = c2+1 WHERE c1 =
@p1
The SELECT is waiting for a Shared KEY lock on
index t1.cidx. The UPDATE holds a conflicting X lock.
The UPDATE is
waiting for an eXclusive KEY lock on index t1.idx1. The SELECT holds a
conflicting S lock.
首先,我們看看p1的執行計畫。怎麼看呢?可以執行set statistics profile on,這句就可以了。下面是p1的執行計畫
SELECT c2, c3 FROM t1 WHERE c2 BETWEEN @p1 AND @p1+1
|--Nested
Loops(Inner Join, OUTER REFERENCES:([Uniq1002], [t1].[c1]))
|--Index Seek(OBJECT:([t1].[idx1]), SEEK:([t1].[c2] >= [@p1] AND [t1].[c2]
<= [@p1]+(1)) ORDERED FORWARD)
|--Clustered Index
Seek(OBJECT:([t1].[cidx]), SEEK:([t1].[c1]=[t1].[c1] AND [Uniq1002]=[Uniq1002])
LOOKUP ORDERED FORWARD)
我們看到了一個nested
loops,第一行,利用索引t1.c2來進行seek,seek出來的那個rowid,在第二行中,用來通過叢集索引來尋找整行的資料。這是什嗎?就是bookmark
lookup啊!為什嗎?因為我們需要的c2、c3不能完全的被索引t1.c1帶出來,所以需要書籤尋找。
好,我們接著看p2的執行計畫。
UPDATE t1 SET c2 = c2+1 WHERE c1 = @p1
|--Clustered Index
Update(OBJECT:([t1].[cidx]), OBJECT:([t1].[idx1]), SET:([t1].[c2] =
[Expr1004]))
|--Compute
Scalar(DEFINE:([Expr1013]=[Expr1013]))
|--Compute
Scalar(DEFINE:([Expr1004]=[t1].[c2]+(1), [Expr1013]=CASE WHEN CASE WHEN
...
|--Top(ROWCOUNT est
0)
|--Clustered Index
Seek(OBJECT:([t1].[cidx]), SEEK:([t1].[c1]=[@p1]) ORDERED FORWARD)
通過叢集索引的seek找到了一行,然後開始更新。這裡注意的是,update的時候,它會申請一個針對clustered index的X鎖的。
實際上到這裡,我們就明白了為什麼update會對select產生死結。update的時候,會申請一個針對clustered
index的X鎖,這樣就阻塞住了(注意,不是死結!)select裡面最後的那個clustered index
seek。死結的另一半在哪裡呢?注意我們的select語句,c2存在於索引idx1中,c1是一個叢集索引cidx。問題就在這裡!我們在p2中更新了c2這個值,所以sqlserver會自動更新包含c2列的非叢集索引:idx1。而idx1在哪裡?就在我們剛才的select語句中。而對這個索引列的更改,意味著索引集合的某個行或者某些行,需要重新排列,而重新排列,需要一個X鎖。
SO………,問題就這樣被發現了。
總結一下,就是說,某個query使用非叢集索引來select資料,那麼它會在非叢集索引上持有一個S鎖。當有一些select的列不在該索引上,它需要根據rowid找到對應的叢集索引的那行,然後找到其他資料。而此時,第二個的查詢中,update正在叢集索引上忙乎:定位、加鎖、修改等。但因為正在修改的某個列,是另外一個非叢集索引的某個列,所以此時,它需要同時更改那個非叢集索引的資訊,這就需要在那個非叢集索引上,加第二個X鎖。select開始等待update的X鎖,update開始等待select的S鎖,死結,就這樣發生鳥。
那麼,為什麼我們增加了一個非叢集索引,死結就消失鳥?我們看一下,按照上文中自動增加的索引之後的執行計畫:
SELECT c2, c3 FROM
t1 WHERE c2 BETWEEN @p1 AND @p1+1
|--Index
Seek(OBJECT:([deadlocktest].[dbo].[t1].[_dta_index_t1_7_2073058421__K2_K1_3]),
SEEK:([deadlocktest].[dbo].[t1].[c2] >= [@p1] AND
[deadlocktest].[dbo].[t1].[c2] <= [@p1]+(1)) ORDERED
FORWARD)
哦,對於clustered
index的需求沒有了,因為增加的覆蓋索引已經足夠把所有的資訊都select出來。就這麼簡單。
實際上,在sqlserver
2005中,如果用profiler來抓eventid:1222,那麼會出現一個死結的圖,很直觀的說。
下面的方法,有助於將死結減至最少(詳細情況,請看SQLServer線上說明,搜尋:將死結減至最少即可。
· 按同一順序訪問對象。
· 避免事務中的使用者互動。
· 保持事務簡短並處於一個批處理中。
· 使用較低的隔離等級。
· 使用基於資料列版本設定的隔離等級。
- 將 READ_COMMITTED_SNAPSHOT 資料庫選項設定為 ON,使得已提交讀事務使用資料列版本設定。
- 使用快照隔離。
· 使用綁定串連。