不知道有沒有人碰到過這樣噁心的問題:兩張表串連查詢並limit,SQL效率很高,但是加上order by以後,語句的執行時間變的巨長,效率巨低。
情況是這麼一個情況:現在有兩張表,team表和people表,每個people屬於一個team,people中有個欄位team_id。
下面給出建表語句: 複製代碼 代碼如下:create table t_team
(
id int primary key,
tname varchar(100)
);
create table t_people
(
id int primary key,
pname varchar(100),
team_id int,
foreign key (team_id) references t_team(id)
);
下面我要串連兩張表查詢出前10個people,按tname排序。
於是,一個SQL語句誕生了:select * from t_people p left join t_team t on p.team_id=t.id order by p.pname limit 10; [語句①]
這個是我第一反應寫的SQL,通俗易懂,也是大多數人的第一反應。然後來測試一下這個語句的執行時間。首先要準備資料。我用預存程序在t_team表中產生1000條資料,在t_people表中產生100000條資料。(預存程序在本文最後)
執行上面那條SQL語句,執行了好幾次,耗時在3秒左右。
再換兩個語句對比一下:
1.把order by子句去掉:select * from t_people p left join t_team t on p.team_id=t.id limit10; [語句②]
耗時0.00秒,忽略不計。
2.還是使用order by,但是把串連t_team表去掉:select * from t_people p order by p.pname limit 10; [語句③]
耗時0.15秒左右。
對比發現[語句①]的效率巨低。
為什麼效率這麼低呢。[語句②]和[語句③]執行都很快,[語句①]不過是二者的結合。如果先執行[語句③]得到排序好的10條people結果後,再串連查詢出各個people的team,效率不會這麼低。那麼只有一個解釋:MySQL先執行串連查詢,再進行排序。
解決方案:如果想提高效率,就要修改SQL語句,讓MySQL先排序取前10條再串連查詢。
SQL語句:
select * from (select * from t_people p order by p.pname limit 10) p left join t_team t on p.team_id=t.id limit 10; [語句④]
[語句④]和[語句①]功能一樣,雖然有子查詢,雖然看起來很彆扭,但是效率提高了很多,它的執行時間只要0.16秒左右,比之前的[語句①] (耗時3秒) 提高了20倍。
這兩個表的結構很簡單,如果遇到複雜的表結構…我在實際開發中就碰到了這樣的問題,使用[語句①]的方式耗時80多秒,但使用[語句④]只需1秒以內。
最後給出造資料的預存程序: 複製代碼 代碼如下:CREATE PROCEDURE createdata()
BEGIN
DECLARE i INT;
START TRANSACTION;
SET i=0;
WHILE i<1000 DO
INSERT INTO t_team VALUES(i+1,CONCAT('team',i+1));
SET i=i+1;
END WHILE;
SET i=0;
WHILE i<100000 DO
INSERT INTO t_people VALUES(i+1,CONCAT('people',i+1),i%1000+1);
SET i=i+1;
END WHILE;
COMMIT;
END