在 MySQL下,在進行中文模糊檢索時,經常會返回一些與之不相關的記錄,如尋找 "%a%" 時,返回的可能有中文字元,卻沒有a字元存在。本人以前也曾遇到過類似問題,經詳細閱讀MySQL的Manual,發現可以有一種方法很方便的解決並得到滿意的結果。
例子:
希望通過“標題”對新聞庫進行檢索,關鍵字可能包含是中英文,如下SQL語句:
以下為引用的內容: QUOTE: select id,title,name from achech_com.news where title like '%a%' |
返回的結果,某些title欄位確定帶了“a”關鍵字,而有些則只有中文,但也隨之返回在檢索結果中。
解決方案,使用 BINARY 屬性進行檢索,如:
以下為引用的內容: QUOTE: select id,title,name from achech_com.news where binary title like '%a%' |
返回的結果較之前正確,但英文字母區分大小寫,故有時在檢索如“Achech”及“achech”的結果是不一樣的。知道了使用 BINARY 屬性可以解決前面這個問題,再看看 MySQL 支援的UCASE 及 CONCAT 函數,其中 UCASE 是將英文全部轉成大寫,而CONCAT函數的作用是對字元進行串連,以下是我們完全解決後的SQL 陳述式:
以下為引用的內容: QUOTE: select id,title,name from achech_com.news where binary ucase(title) like concat('%',ucase('a'),'%') |
檢索的步驟是先將屬性指定為 BINARY ,以精確檢索結果,而被 like 的 title內容存在大小寫字母的可能,故先使用 ucase 函數將欄位內容全部轉換成大寫字母,然後再進行 like 操作,而 like 的操作使用模糊方法,使用 concat的好處是傳進來的可以是直接的關鍵字,不需要帶“%”萬用符,將“'a'”直接換成你的變數,在任何語言下都萬事無憂了。 當然你也可以這麼寫:
以下為引用的內容: QUOTE: select id,title,name from achech_com.news where binary ucase(title) like ucase('%a%') |
檢索的結果還算滿意吧,不過速度可能會因此而慢N毫秒。