標籤:mysql字元集導致的亂碼問題!
MySQL字元集導致的亂碼問題
MySQL的字元集支援(Character Set Support)有兩個方面:
1、字元集(Character set)
2、排序方式(Collation)。
對於字元集的支援細化到四個層次:
1、伺服器(server)
2、資料庫(database)
3、資料表(table)
4、串連(connection)
注意:MySQL對於字元集的指定可以細化到一個資料庫,一張表,一列,應該用什麼字元集。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第一問:mysql預設字元集能否進行修改呢?必須滴!
1、修改設定檔:
[mysqld]
default-character-set = utf8
default-collation=utf8_general_ci
#character_set_server = utf8
#[client]
#default-character-set=utf8
修改完後,重啟mysql的服務,service mysql restart
2、命令修改(不推薦,除非有特殊情況)
mysql> SET character_set_client = utf8 ;
mysql> SET character_set_connection = utf8 ;
mysql> SET character_set_database = utf8 ;
mysql> SET character_set_results = utf8 ;
mysql> SET character_set_server = utf8 ;
mysql> SET collation_connection = utf8 ;
mysql> SET collation_database = utf8 ;
mysql> SET collation_server = utf8 ;
有時候設定了表的預設字元集為utf8並且通過UTF-8編碼發送查詢,存入資料庫的仍然是亂碼。那connection串連層上可能出了問題。解決方案是在發送查詢前執行一下下面這句: SET NAMES ‘utf8‘;它相當於下面的三句指令:
SET character_set_client = utf8;
SET character_set_results = utf8;
SET character_set_connection = utf8;
注意:具體的參數和MySQL的安裝方式以及版本有密切關係,比較成熟的版本預設字元集是utf-8,當然具體怎麼定義,可參考官方文檔。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第二問:查看MySQL預設字元集(預設情況下,mysql的字元集是latin1)
通常,查看系統的字元集和排序方式的設定可以通過下面的兩條命令:
SHOW VARIABLES LIKE ‘character%‘;
SHOW VARIABLES LIKE ‘collation_%‘;
650) this.width=650;" src="http://s3.51cto.com/wyfs02/M01/83/D9/wKiom1d9_ObiE0HzAACCrMHX-0I370.png-wh_500x0-wm_3-wmp_4-s_3666084395.png" title="1.png" alt="wKiom1d9_ObiE0HzAACCrMHX-0I370.png-wh_50" />
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第三問:傳統的程式在建立資料庫和資料表時並沒有使用那麼複雜的配置,它們用的是預設的配置,那麼,預設的配置從何而來呢?
(1)編譯MySQL 時,指定了一個MySQL預設的字元集,這個字元集是 latin1;
(2)安裝MySQL 時,可以在設定檔 (my.cnf,或者my.ini) 中指定一個預設的的字元集,如果沒指定,這個值繼承自編譯時間指定的;
(3)啟動mysqld 時,可以在命令列參數中指定一個預設的的字元集,如果沒指定,這個值繼承自設定檔中的配置,此時 character_set_server 被設定為這個預設的字元集;
(4)當建立一個新的資料庫時,除非明確指定,這個資料庫的字元集被預設設定為character_set_server;
(5)當選定了一個資料庫時,character_set_database 被設定為這個資料庫預設的字元集;
(6)在這個資料庫裡建立一張表時,表預設的字元集被設定為 character_set_database,也就是這個資料庫預設的字元集;
(7)當在表內設定一欄時,除非明確指定,否則此欄預設的字元集就是表預設的字元集;
簡單的總結一下,如果什麼地方都不修改,那麼所有的資料庫的所有表的所有欄位的都用 latin1 儲存,不過我們如果安裝 MySQL,一般都會選擇多語言支援,也就是說,安裝程式會自動在設定檔中把 default_character_set 設定為 UTF-8,這保證了預設情況下,所有的資料庫的所有表的所有欄位的都用 UTF-8 儲存。
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第四問:還有什麼情況下會由於MySQL的原因導致亂碼?
這種情況可能和使用高可用軟體或者外掛程式導致的,比如mysql-proxy等
例子:mysql proxy 亂碼問題
有時候通過proxy連上資料庫之後,查到的字串始終是亂碼,即便手工執行了set names ‘utf8′也沒有效果。
解決辦法,mysql server必須設定
修改my.cnf檔案
[mysqld]
skip-character-set-client-handshake
init-connect=‘SET NAMES utf8‘
default-character-set=utf8
~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
第五問:什麼原因還會導致亂碼問題?
1、瀏覽器
2、代理
3、web
4、配置不當
5、代碼問題
6、資料庫
。。。。。。。
總之,有很多原因都可能導致網站亂碼,根據自己的實際情況來排除,這裡只是討論MySQL問題,其它原因,不予深究。
寫個部落格,分享給大家,哪裡有錯誤,歡迎指正!
本文出自 “任志遠@IT分享” 部落格,謝絕轉載!
MySQL字元集導致的亂碼問題!