標籤:迴圈 設計 集中 括弧 where ted 增加 sele union all
一、多表查詢串連的選擇:
相信這內串連,左串連什麼的大家都比較熟悉了,當然還有左外串連什麼的,基本用不上我就不貼出來了。這圖只是讓大家回憶一下,各種串連查詢。 然後要告訴大家的是,需要根據查詢的情況,想好使用哪種串連方式效率更高。(這是技術文)
二、MySQL的JOIN實現原理
在MySQL 中,只有一種Join 演算法,就是大名鼎鼎的Nested Loop Join,他沒有其他很多資料庫所提供的Hash Join,也沒有Sort Merge Join。顧名思義,Nested Loop Join 實際上就是通過驅動表的結果集作為迴圈基礎資料,然後一條一條的通過該結果集中的資料作為過濾條件到下一個表中查詢資料,然後合并結果。如果還有第三個參與Join,則再通過前兩個表的Join 結果集作為迴圈基礎資料,再一次通過迴圈查詢條件到第三個表中查詢資料,如此往複。 ——摘自《MySQL 效能調優與架構設計》
–
三、補充:mysql對sql語句的容錯問題
即在sql語句不完全符合書寫建議的情況,mysql會允許這種情況,儘可能解釋它:
1)一般cross join後面加上where條件,但是用cross join+on也是被解釋為cross join+where;
2)一般內串連都需要加上on限定條件,如上面情境一;如果不加會被解釋為交叉串連;
3)如果串連表格使用的是逗號,會被解釋為交叉串連;
註:sql標準中還有union join和natural inner join,mysql不支援,而且本身也沒有多大意義,其實就是為了“健壯”。但是其實結果可以用上面的幾種串連方式得到。
三、超大型資料儘可能儘力不要寫子查詢,使用串連(JOIN)去替換它:
當然,關於這句話,也不一定就全是這樣。
1)因為在大型的資料處理中,子查詢是非常常見的,特別是在查詢出來的資料需要進一步處理的情況,無論是可讀性還是效率上,這時候的子查都是更優。
2)然而在一些特定的情境,可以直接從資料庫讀取就可以的,比如一個表(A表 a,b,c欄位,需要內部資料交集)join自己的效率必然比放一個子查在where中快得多。(這真是技術文)
四、使用聯合(UNION)來代替手動建立的暫存資料表
UNION是會把結果排序的!!!
union查詢:它可以把需要使用暫存資料表的兩條或更多的select查詢合并的一個查詢中(即把兩次或多次查詢結果合并起來。)。在用戶端的查詢會話結束的時候,暫存資料表會被自動刪除,從而保證資料庫整齊、高效。使用union來建立查詢的時候,我們只需要用UNION作為關鍵字把多個select語句串連起來就可以了,要注意的是所有select語句中的欄位數目要想同。
#
要求:兩次查詢的列數必須一致(列的類型可以不一樣,但推薦查詢的每一列,相對應的類型要一樣)
可以來自多張表的資料:多次sql語句取出的列名可以不一致,此時以第一個sql語句的列名為準。
如果不同的語句中取出的行,有完全相同(這裡表示的是每個列的值都相同),那麼union會將相同的行合并,最終只保留一行。也可以這樣理解,union會去掉重複的行。
如果不想去掉重複的行,可以使用union all。
如果子句中有order by,limit,需用括弧()包起來。推薦放到所有子句之後,即對最終合并的結果來排序或篩選。
注意:
1、UNION 結果集中的列名總是等於第一個 SELECT 語句中的列名
2、UNION 內部的 SELECT 語句必須擁有相同數量的列。列也必須擁有相似的資料類型。同時,每條 SELECT 語句中的列的順序必須相同
UNION ALL的作用和文法:
預設地,UNION 操作符選取不同的值。如果允許重複的值,請使用 UNION ALL。當 ALL 隨 UNION 一起使用時(即 UNION ALL),不消除重複行。
五、總結
(1)對於要求全面的結果時,我們需要使用串連操作(LEFT JOIN / RIGHT JOIN / FULL JOIN);
(2)應盡量避免在 where 子句中對欄位進行 null 值判斷,否則將導致引擎放棄使用索引而進行全表掃描,如:
備忘、描述、評論之類的可以設定為 NULL,其他最好不要使用NULL。
不要以為 NULL 不需要空間,比如:char(100) 型,在欄位建立時,空間就固定了, 不管是否插入值(NULL也包含在內),都是佔用 100個字元的空間的,如果是varchar這樣的變長欄位, null 不佔用空間。
可以在num上設定預設值0,確保表中num列沒有null值,然後這樣查詢:
select id from t where num = 0
(3)in 和 not in 也要慎用,否則會導致全表掃描,如:
對於連續的數值,能用 between 就不要用 in 了:
很多時候用 exists 代替 in 是一個好的選擇:
(4)盡量使用數字型欄位,若只含數值資訊的欄位盡量不要設計為字元型,這會降低查詢和串連的效能,並會增加儲存開銷。這是因為引擎在處理查詢和連 接時會逐個比較字串中每一個字元,而對於數字型而言只需要比較一次就夠了。
(5)盡量使用表變數來代替暫存資料表。如果表變數包含大量資料,請注意索引非常有限(只有主鍵索引)。
(6)不要以為使用MySQL的一些串連操作對查詢有多麼大的改善,其實核心是索引(別打我,下一篇講)(這絕對是技術文)
「mysql最佳化專題」你們要的多表查詢最佳化來啦!請查收(4)