這次介紹一下T-SQL中“Not IN” 和“Not Exists”的最佳化。
Not IN 和 Not Exists 命令 :
有些情況下,需要select/update/delete 操作孤立資料。孤立資料:不存在主表中而存在其關聯表中。
操作這樣的資料,一般第一反應是利用“Not in” 或 “Not Exists”命令。使用Not IN會嚴重影響效能,因為這個命令會逐一檢查每個記錄,就會造成資源緊張,尤其是當對大資料進行更新和刪除操作時,可能導致資源被這些操作鎖住。
選擇NOT IN 還是 NOT Exists
現在SQL Server 中有兩個命令可以使用大資料的插入、更新、刪除操作,效能方面比NOT IN有很大的提高,文法簡單比NOT Exists好很多,寫出來的語句看上去很清爽。 現在就請它們閃亮登場,Merge 和 Except。
例子:
首先建立兩個表
1 use [MyTest]2 create table Test1 ([id] int, [name] varchar(20))3 create table Test2 ([id] int, [name] varchar(20), [address] varchar(100))
1 declare @RowC int2 declare @Name varchar(20)3 set @RowC = 04 while @RowC < 4000005 Begin6 set @Name = 'TestName' + CAST(@RowC as varchar(10))7 insert into Test1(id, name) values(@RowC, @Name)8 set @RowC = @RowC+19 end
1 declare @RowC int 2 declare @Name varchar(20) 3 declare @Address varchar(100) 4 set @RowC = 0 5 while @RowC < 500000 6 Begin 7 set @Name = 'TestName' + CAST(@RowC as varchar(10)) 8 set @Address = 'TestAddress' + CAST(@RowC as varchar(10)) 9 insert into Test2([id], [name], [address]) values(@RowC, @Name, @Address)10 set @RowC = @RowC+111 end
使用Not IN命令Select/update/delete操作:
1 SELECT [name] FROM Test2 where [name] not in (select [name] from Test1)2 UPDATE Test2 SET [name] =N'New_Name' where [name] not in (select [name] from Test1)3 DELETE Test2 FROM Test2 where [name] not in (select [name] from Test1)
使用效能更好文法更簡潔的Merge and Except:
1 merge Test2 T using (select name from Test2 except select name from Test1 )S on t.name=s.name2 when matched then update SET name=N'New_Name' ;3 merge Test2 T using (select name from Test2 except select name from Test1 )S on t.name=s.name4 when matched then delete ;5 SELECT * FROM Test2 S where not exists (select 1 from Test2 inner join Test1 on Test2.name=Test1.name and Test2.name=s.name)
注意,上面還是有一部分使用了Not Exists:
1 SELECT name FROM Test2 S where not exists (select 1 from Test2 inner join Test1 on Test2.name=Test1.name and Test2.name=s.name)
現在需要使用簡潔的Except:
1 select name from Test1 except select name from Test2
在這裡只是給出了例子,沒有拿出實際的對比資料。但是Merge 和Except 兩個命令在大資料的處理方面的效能,要比
Not IN 好很多,代碼簡潔程度上,要比和Not EXISTS好很多。不管你信不信,反正我信了!!!
上測試資料嘍:Test1中有400000條資料,Test2中有500000條資料其中100000條資料的name是不同
Select Not IN:18秒
Select Except:幾乎沒有花費時間
Update Not IN: 19秒
Update Except、Merge:
刪除操作和上面兩個操作時間基本一樣,在這裡就不片了。
Not Exists效能上面並沒有比except好多少。在我的測試資料上,兩個幾乎是在1秒以內完成操作的!!!
在次謝謝@徐少俠的評價及意見,希望大家看一下。