1、regexp_like功能強大,但效率比like要差;
2、若使用like的欄位上無索引,且匹配字串前後都有%,則instr效率高;
3、若使用like的欄位上有索引,且匹配字串前後都有%,若僅操作索引欄位則like效率高,若有其他欄位則instr效率高,可能的原因是僅操作索引欄位不會全表掃描而是採用全索引掃描;
4、若使用like的欄位上有索引,且僅匹配字串結尾有%,則like效率高,因為like使用到了索引,而instr會造成索引失效走且表掃描;
綜上所述,like和instr哪個效率高要視情況而定,兩者效率均高於regexp_like。
【實驗】
註:本實驗轉自網路,但原出處無法查實故未添加引用連結,若有侵權請聯絡我。
例如:t表中將近有1100萬資料,我們要進行字串匹配,經過實際測試發現,like與instr函數在效能上有一定差別,測試結果如下:
SQL> set timing on
SQL> select count(*) from t where instr(title,'手冊')>0;
COUNT(*)
----------
65881
Elapsed: 00:00:11.04
SQL> select count(*) from t where title like '%手冊%';
COUNT(*)
----------
65881
Elapsed: 00:00:31.47
SQL> select count(*) from t where instr(title,'手冊')=0;
COUNT(*)
----------
11554580
Elapsed: 00:00:11.31
SQL> select count(*) from t where title not like '%手冊%';
COUNT(*)
----------
11554580
另外一個2億多的表,使用8個並行,使用like查詢很久都不出來結果,但使用instr函數4分鐘即完成尋找,效能是相當的好。這些小技巧用好,工作效率提高不少。
說明:instr(title, 'aaa')>0功能相當於like,instr(title, 'aaa')=0功能相當於not like,但是效率不同。
若在title欄位上加非唯一性索引:
create index idx_t_ title on t(title);
這樣,再使用
select * from t where instr(title,'手冊')>0;
這樣的語句查詢,效率可以提高不少,表資料量越大時instr優勢越明顯。
若不帶其他欄位,如下:
select count(1) from t where title like '%手冊%';
select count(1) from t where instr(title,'手冊')>0;
結果發現,like的效率要大大優於instr。