MySQL之字元集與校對集
一、字元集
1.MySQL的字元集設定非常靈活
- 可以設定伺服器預設字元集;
- 資料庫預設字元集;
- 表預設字元集;
- 列字元集;
如果某一層級沒有指定字元集,則繼承上一級。
查看所有字元集語句:show character set;
2.以表聲明為utf-8為例,最終儲存在表中的資料為utf-8
①我們要告訴伺服器,我給你發送的資料是什麼編碼?character_set_client
②告訴字元集轉換器,轉換成什麼編碼?character_set_connection
③查詢的結果用什麼編碼?character_set_results
如果以上三者都為字元集N,可簡寫為set names N;
3.什麼情況下會出現亂碼呢?
我們首先建立一個測試表指定表的字元集為utf8
create table temp(
name varchar(10)
) charset utf8;
然後執行這三條命令:
set character_set_client=gbk;
set character_set_connection=gbk;
set_character_set_results=gbk; 這三句可以簡寫為set names gbk;
最後往表裡插入一條資料:
insert into temp values('中國');
select * from temp;這時候顯示的結果是正常的。
當我們再執行這句命令時:set character_results=utf8;
出現亂碼了,
由此可得出當返回的結果result的字元集與用戶端的字元集不符的時候會出現亂碼。
還有一種情況也會出現亂碼:client聲明與事實不符時,你用戶端明明是utf8,你卻非要叫我轉成gbk的,如:
可能還有很多種情況,這裡沒有一一列舉。
4.什麼情況下會造成資料的丟失呢?
執行這三條語句:
set character_set_client=gbk;
set character_set_connection=latin1;
set character_set_results=gbk;
再往表裡插入一條資料:insert into temp values('美國');
最後查詢的時候結果如:
資料丟失了。
由此可得出當connection和伺服器的字元集比client小時,會造成資料的丟失,可能用語不是很準確,但是能理解即可以了。個人理解,就跟java裡面不同資料類型相互轉換時一樣,比如把double類型強制轉換成int類型,就會造成精度的丟失一樣。
。。。。。。
二、校對集
什麼是校對集?
校對集:指字元集的定序。
查看所有校對集語句:show collation;
一種字元集可以有一個或多個定序。
以utf8為例,預設是使用utf8_general_ci校對集,也可以按二進位來排,utf8_bin
怎樣聲明校對集?
create table tableName
(
...
)charset utf8 collate utf8_general_ci;
注意:聲明的校對集必須是字元集合法的校對集。比如你字元集是utf8,你不能聲明gbk的校對集。
三、校對規則的“可壓縮性”
在絕大多數查詢中,mysql使用哪種校對規則進行比較是很顯然的。例如,在下列情況中,校對規則明顯的是“列x的列校對規則”:
select x from T orderbyx;
select x from T wherex = x;
select distinct x fromT;
但是,當涉及多個運算元時,可能不明確。例如:
select x from T wherex ='Y';
這個查詢應該使用列x的校對規則,還是字串文字'Y'的校對規則?
標準化SQL使用“可壓縮性”規則解決這種問題。基本上,這個意思是:既然x和'Y'都有 校對規 則,哪個校對規則優先?這可能比較難解決,但是以下規則適合大多數情況:
一個外在的COLLATE子句可壓縮性是0(根本不能壓縮。)使用不同校對規則的兩個字串串連的可壓縮性是1。列校對規則的可壓縮性是2。“系統常數”(如USER()或VERSION()函數返回的字串)可壓縮性是3。文字規則的可壓縮性是4。NULL或從NULL派生的運算式的可壓縮性是 5。
上述可壓縮性值是mysql當前所用的。
這樣上述規則可以模糊解決:
使用最低的可壓縮性值的校對規則。如果兩側有相同的可壓縮性,那麼如果校對規則不同則發生錯誤。
使用COERCIBILITY()函數確定一個字串運算式的可壓縮性:
mysql> SELECTCOERCIBILITY('A'COLLATE latin1_swedish_ci);
-> 0
mysql> SELECTCOERCIBILITY(VERSION());
-> 3
mysql> SELECTCOERCIBILITY('A');
-> 4
本文永久更新連結地址: