標籤:
從MySQL 4.1開始引入多語言的支援,但是用PHP插入的中文會出現亂碼.無論用什麼編碼也不行.
解決這個問題其實很簡單.
1.在建表的時候設定編碼類別型為gb2312_chinese_ci.
2.在PHP頁面的資料庫連接語句加一行mysql_query("SET NAMES ‘gb2312‘",$link); 例如
$db_host="localhost";
$db_user="root";
$db_password="password";
$db_name="test";
$link=mysql_connect($db_host,$db_user,$db_password);
mysql_query("SET NAMES ‘gb2312‘",$link);
$db=mysql_select_db($db_name,$link);
$query="select * from user";
$result=mysql_query($query);
寫入頁面和讀取頁面都加入這行.這樣在MYSQL裡面的中文就能正常顯示了.
相關資料:
從MySQL 4.1開始引入多語言的支援,而且一些特性已經超過了其他的資料庫系統。
MySQL4.1的字元集支援(Character Set Support)有兩個方面:字元集(Characterset)和排序方式(Collation)。對於字元集的支援細化到四個層次:伺服器(server),資料庫(database),資料表(table)和串連(connection)。
查看系統的字元集和排序方式的設定可以通過下面的兩條命令:!
mysql> show variables like ‘character_set_%‘;
+--------------------------+----------------------------+
| Variable_name | Value |
+--------------------------+----------------------------+
| character_set_client | latin1 |
| character_set_connection | latin1 |
| character_set_database | latin1 |
| character_set_results | latin1 |
| character_set_server | latin1 |
| character_set_system | utf8 |
| character_sets_dir | /usr/share/mysql/charsets/ |
+--------------------------+----------------------------+
7 rows in set (0.00 sec)
mysql> show variables like ‘collation_%‘;
+----------------------+-------------------+
| Variable_name | Value |
+----------------------+-------------------+
| collation_connection | latin1_swedish_ci |
| collation_database | latin1_swedish_ci |
| collation_server | latin1_swedish_ci |
+----------------------+-------------------+
3 rows in set (0.00 sec)
上面列出的值就是系統的預設值。(很奇怪系統怎麼預設是latin1的瑞典語排序方式)...
當我們按照原來的方式通過PHP存取MySQL資料庫時,就算設定了表的預設字元集為utf8並且通過UTF-8編碼發送查詢,你會發現存入資料庫的仍然是亂碼。問題就出在這個connection串連層上。解決方案是在發送查詢前執行一下下面這句:
set names ‘utf8‘;
它相當於下面的四句指令:
set character_set_client = utf8;
set character_set_results = utf8;
set character_set_connection = utf8;
set collation_connection = utf8_general_ci
由於預設網頁提交的查詢是gb2312(表單頁面meta裡可以看到),而mysql預設將其當作utf8(可以查到此時的character_set_client=utf8),所以必然亂碼。同理,mysql返回的結果是已經轉換成character_set_results編碼的(與表的編碼無關),同樣預設是utf8,而網頁頁面把它當gb2312處理,所以必然有標題等由資料庫讀出的欄位是亂碼而其他php部分文字不亂碼的現象。
解決(by 一劍飄雪):
安裝mysql5.0時要選utf8字元集(在用phpmyadmin建立資料庫和欄位時就不需要在整理中選utf8字元集了),並在php建立串連後發送
$link = mysql_connect(‘localhost‘, ‘root‘, ‘root‘);
mysql_query("SET NAMES ‘utf8‘",$link);
這時我們在網頁中看到的還是亂碼但已不是????了,查看網頁源檔案,已完全正常。用記事本開啟php源檔案,別存為utf8編碼,再重新整理網頁,全部搞定了。
或者,當然還是要安裝時仍要utf8安裝,在php中發送set names ‘gb2312‘,同時php檔案存為記事本預設的ansi,也能正確顯示中文.
但總不能每次串連時都發送一次SET NAMES ‘utf8‘吧,如何徹底解決還沒找到方法。
這樣安裝mysql時預設字元集選為utf8後又帶來一個問題,我們在command.exe中進入mysql控制台後,查詢結果又成了亂碼,我們可以在查詢前輸入
mysql>set names ‘gbk‘;
或
mysql>set names ‘gb2312‘;
相當於告訴mysql用戶端在使用gb2312字元集,結果就正確了,gb2312為GBK的子集.
PHP-MYSQL中文亂碼問題.