SQL Server 查詢處理中的各個階段
SQL 不同於與其他程式設計語言的最明顯特徵是處理代碼的順序。在大數程式設計語言中,代碼按編碼順序被處理,但是在SQL語言中,第一個被處理的子句是FROM子句,儘管SELECT語句第一個出現,但是幾乎總是最後被處理。
每個步驟都會產生一個虛擬表,該虛擬表被用作下一個步驟的輸入。這些虛擬表對調用者(用戶端應用程式或者外部查詢)不可用。只是最後一步產生的表才會返回給調用者。如果沒有在查詢中指定某一子句,將跳過相應的步驟。下面是對應用於SQL server 2000和SQL Server 2005的各個邏輯步驟的簡單描述。
邏輯查詢處理階段簡介
- FROM:對FROM子句中的前兩個表執行笛卡爾積(Cartesian product)(交叉聯結),產生虛擬表VT1
- ON:對VT1應用ON篩選器。只有那些使<join_condition>為真的行才被插入VT2。
- OUTER(JOIN):如果指定了OUTER JOIN(相對於CROSS JOIN 或(INNER JOIN),保留表(preserved table:左方外部聯結把左表標記為保留表,右方外部聯結把右表標記為保留表,完整外部聯結把兩個表都標記為保留表)中未找到匹配的行將作為外部行添加到VT2,產生VT3.如果FROM子句包含兩個以上的表,則對上一個聯結產生的結果表和下一個表重複執行步驟1到步驟3,直到處理完所有的表為止。
- WHERE:對VT3應用WHERE篩選器。只有使<where_condition>為true的行才被插入VT4.
- GROUP BY:按GROUP BY子句中的列列表對VT4中的行分組,產生VT5.
- CUBE|ROLLUP:把超組(Suppergroups)插入VT5,產生VT6.
- HAVING:對VT6應用HAVING篩選器。只有使<having_condition>為true的組才會被插入VT7.
- SELECT:處理SELECT列表,產生VT8.
- DISTINCT:將重複的行從VT8中移除,產生VT9.
- ORDER BY:將VT9中的行按ORDER BY 子句中的列列表排序,產生遊標(VC10).
- TOP:從VC10的開始處選擇指定數量或比例的行,產生表VT11,並返回調用者。
註:步驟10,按ORDER BY子句中的列列表排序上步返回的行,返回遊標VC10.這一步是第一步也是唯一一步可以使用SELECT列表中的列別名的步驟。這一步不同於其它步驟的是,它不返回有效表,而是返回一個遊標。SQL是基於集合理論的。集合不會預先對它的行排序,它只是成員的邏輯集合,成員的順序無關緊要。對錶進行排序的查詢可以返回一個對象,包含按特定物理順序組織的行。ANSI把這種對象稱為遊標。理解這一步是正確理解SQL的基礎。
因為這一步不返回表(而是返回遊標),使用了ORDER BY子句的查詢不能用作表運算式。表運算式包括:視圖、內聯資料表值函式、子查詢、派生表和共用運算式。它的結果必須返回給期望得到物理記錄的用戶端應用程式。例如,下面的派生表查詢無效,併產生一個錯誤:
select * from(select orderid,customerid from orders order by orderid) as d
下面的視圖也會產生錯誤
create view my_viewasselect *from ordersorder by orderid
在SQL中,表運算式中不允許使用帶有ORDER BY子句的查詢,而在T—SQL中卻有一個例外(應用TOP選項)。
所以要記住,不要為表中的行假設任何特定的順序。換句話說,除非你確定要有序行,否則不要指定ORDER BY 子句。排序是需要成本的,SQL Server需要執行有序索引掃描或使用排序運行符。
推薦一段SQL代碼:行列轉置
Code
/**//*問題:假設有張學產生績表(tb)如下:
姓名 課程 分數
張三 語文 74
張三 數學 83
張三 物理 93
李四 語文 74
李四 數學 84
李四 物理 94
想變成(得到如下結果):
姓名 語文 數學 物理
---- ---- ---- ----
李四 74 84 94
張三 74 83 93
-------------------
*/
create table tb(姓名 varchar(10),課程 varchar(10),分數 int)
insert into tb values('張三' , '語文' , 74)
insert into tb values('張三' , '數學' , 83)
insert into tb values('張三' , '物理' , 93)
insert into tb values('李四' , '語文' , 74)
insert into tb values('李四' , '數學' , 84)
insert into tb values('李四' , '物理' , 94)
go
--SQL SERVER 2000 靜態SQL,指課程只有語文、數學、物理這三門課程。(以下同)
select 姓名 as 姓名 ,
max(case 課程 when '語文' then 分數 else 0 end) 語文,
max(case 課程 when '數學' then 分數 else 0 end) 數學,
max(case 課程 when '物理' then 分數 else 0 end) 物理
from tb
group by 姓名