因為utf8字元集是目前最適合於實現多種不同字元集之間的轉換的字元集,儘管你在命令列工具上可能無法正確查看資料庫中的內容,我依然強烈建議使用utf8作為預設字元集
接下來是完整的一個例子:
1.建立資料庫表
mysql>CREATE DATABASE IF NOT EXISTS my_db default charset utf8 COLLATE utf8_general_ci;
#注意後面這句話 "COLLATE utf8_general_ci",大致意思是在排序時根據utf8校正集來排序
#那麼在這個資料庫下建立的所有資料表的預設字元集都會是utf8了
mysql>create table my_table (name varchar(20) not null default '')type=myisam default charset utf8;
#這句話就是建立一個表了,制定預設字元集為utf8
2.寫資料
例子1是通過php直接插入資料:
a.php 複製代碼 代碼如下:<?php
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
//請注意,這步很關鍵,如果沒有這步,所有的資料讀寫都會不正確的
//它的作用是設定本次資料庫聯結過程中,資料轉送的預設字元集
//其他程式設計語言/介面也類似,例如 .net/c#/odbc
//jdbc則設定連接字串為類似"jdbc:mysql://localhost/db?user=user&password=123456&useUnicode=true&characterEncoding=UTF-8"
mysql_query("set names utf8;");
//必須將gb2312(本地編碼)轉換成utf-8,也可以使用iconv()函數
mysql_query(mb_convet_encoding("insert into my_table values('測試');", "utf-8", "gb2312"));
?>
例子是通過頁面提交插入資料2:
b.php 複製代碼 代碼如下:<?php
//輸出本頁編碼為utf-8
header("content-type:text/html; charset=utf-8");
mysql_connect('localhost','user','password');
mysql_select_db('my_db');
if(isset($_REQUEST['name'))
{
//由於上面已經指定本頁字元集為utf-8了,因此無需轉換編碼
mysql_query(sprintf("insert into my_table values('%s');", $_REQUEST['name']));
}
$q = mysql_query("select * from my_table");
while($r = mysql_fetch_row($q))
{
print_r($r);
}
?>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<form action="" method="post">
<input type="text" name="name" value="">
<input type="submit" value='submit'>
</form>
自此,使用utf8字元集的完整的例子結束了.
如果你想使用gb2312編碼,那麼建議你使用latin1作為資料表的預設字元集,這樣就能直接用中文在命令列工具中插入資料,並且可以直接顯示出來.而不要使用gb2312或者gbk等字元集,如果擔心查詢排序等問題,可以使用binary屬性約束,例如:
create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;
附1:舊資料升級辦法
以原來的字元集為latin1為例,升級成為utf8的字元集。原來的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。
第一步:匯出舊資料
mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql
第二步:轉換編碼(類似unix/linux環境下)
iconv -t utf-8 -f gb2312 -c old.sql > new.sql
或者可以去掉 -f 參數,讓iconv自動判斷原來的字元集
iconv -t utf-8 -c old.sql > new.sql
在這裡,假定原來的資料預設是gb2312編碼。
第三步:匯入
修改old.sql,在插入/更新語句開始之前,增加一條sql語句: "SET NAMES utf8;",儲存。
mysql -hlocalhost -uroot my_db < new.sql
大功告成!!
附2:支援查看utf8字元集的MySQL用戶端有
1.) MySQL-Front,據說這個項目已經被MySQL AB勒令停止了,不知為何,如果國內還有不少破解版可以下載(不代表我推薦使用破解版 :-P)。
2.) Navicat,另一款非常不錯的MySQL用戶端,漢化版剛出來,還邀請我試用過,總的來說還是不錯的,不過也需要付費。
3.) PhpMyAdmin,開源的php項目,非常好。
4.) Linux下的終端工具(Linux terminal),把終端的字元集設定為utf8,串連到MySQL之後,執行 SET NAMES UTF8; 也能讀寫utf8資料了。
附3:直接使用MySQL提供的 ALTER 文法轉換字元集
這對廣大非utf8又想轉成utf8的使用者來說,是個天大的喜訊,我也是在學習MySQL手冊是才發現的。具體用法如下:
ALTER TABLE OLD_TABLE CONVERT TO CHARACTER SET charset_name [COLLATE collation_name];
轉換之前,記得要先備份舊錶,以防萬一。下面是一個實際的例子:
ALTER TABLE `t_yejr` CONVERT TO CHARACTER SET UTF8;
這個方法應該是從MySQL 4.1才開始提供的,大家可以檢查一下自己的版本是否支援,如果不支援,只好按照上面提到的轉換了。enjoy it!!!