小談MySQL字元集

來源:互聯網
上載者:User

作/譯者:葉金榮(Email:
),來源:http://imysql.cn
,轉載請註明作/譯者和出處,並且不能用於商業用途,違者必究。

首先,這片文章純粹是我的個人經驗之談,適用於我常見的環境及項目中.
個人建議,資料庫字元集盡量使用utf8(HTML頁面對應的是utf-8),以使你的資料能很順利的實現遷移,因為utf8字元集是目前最適合於實現多
種不同字元集之間的轉換的字元集,儘管你在命令列工具上可能無法正確查看資料庫中的內容,我依然強烈建議使用utf8作為預設字元集.
接下來是完整的一個例子:
1.建立資料庫表
mysql>CREATE DATABASE IF NOT EXISTS my_db default charset utf8 COLLATE utf8_general_ci;
#注意後面這句話 "COLLATE utf8_general_ci",大致意思是在排序時根據utf8校正集來排序
#那麼在這個資料庫下建立的所有資料表的預設字元集都會是utf8了

mysql>create table my_table (name varchar(20) not null default '')type=myisam default charset utf8;
#這句話就是建立一個表了,制定預設字元集為utf8

2.寫資料
例子1是通過php直接插入資料:
a.php
<?php
mysql_connect('localhost','user','password');
mysql_select_db('my_db');

//請注意,這步很關鍵,如果沒有這步,所有的資料讀寫都會不正確的
//它的作用是設定本次資料庫聯結過程中,資料轉送的預設字元集
//其他程式設計語言/介面也類似,例如 .net/c#/odbc
//jdbc則設定連接字串為類似"jdbc:mysql://localhost/db?user=user&password=123456&useUnicode=true&characterEncoding=UTF-8"

mysql_query("set names utf8;");

//必須將gb2312(本地編碼)轉換成utf-8,也可以使用iconv()函數
mb_convert_encoding("insert into my_table values('測試');", "utf-8", "gb2312");
?>

例子是通過頁面提交插入資料2:
b.php
<?php
//輸出本頁編碼為utf-8
header("content-type:text/html; charset=utf-8");

mysql_connect('localhost','user','password');
mysql_select_db('my_db');

mysql_query("set names utf8;");

if(isset($_REQUEST['name'))
{
//由於上面已經指定本頁字元集為utf-8了,因此無需轉換編碼
mysql_query(sprintf("insert into my_table values('%s');", $_REQUEST['name']));
}

$q = mysql_query("select * from my_table");
while($r = mysql_fetch_row($q))
{
print_r($r);
}
?>

<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<form action="" method="post">
<input type="text" name="name" value="">
<input type="submit" value='submit'>
</form>

自此,使用utf8字元集的完整的例子結束了.
如果你想使用gb2312編碼,那麼建議你使用latin1作為資料表的預設字元集,這樣就能直接用中文在命令列工具中插入資料,並且可以直接顯示出來.而不要使用gb2312或者gbk等字元集,如果擔心查詢排序等問題,可以使用binary屬性約束,例如:
create table my_table ( name varchar(20) binary not null default '')type=myisam default charset latin1;

附1:舊資料升級辦法
以原來的字元集為latin1為例,升級成為utf8的字元集。原來的表: old_table (default charset=latin1),新表:new_table(default charset=utf8)。
第一步:匯出舊資料
mysqldump --default-character-set=latin1 -hlocalhost -uroot -B my_db --tables old_table > old.sql
第二步:轉換編碼(類似unix/linux環境下)
iconv -t utf-8 -f gb2312 -c old.sql > new.sql
或者可以去掉 -f 參數,讓iconv自動判斷原來的字元集
iconv -t utf-8 -c old.sql > new.sql
在這裡,假定原來的資料預設是gb2312編碼。
第三步:匯入
修改old.sql,在插入/更新語句開始之前,增加一條sql語句:

"SET NAMES utf8;"

,儲存。
mysql -hlocalhost -uroot my_db < new.sql
大功告成!!

附2:支援查看utf8字元集的MySQL用戶端有
1.) MySQL-Front,據說這個項目已經被MySQL AB勒令停止了,不知為何,如果國內還有不少破解版可以下載(不代表我推薦使用破解版 :-P)。
2.) Navicat,另一款非常不錯的MySQL用戶端,漢化版剛出來,還邀請我試用過,總的來說還是不錯的,不過也需要付費。
3.) PhpMyAdmin,開源的php項目,非常好。
4.) Linux下的終端工具(Linux terminal),把終端的字元集設定為utf8,串連到MySQL之後,執行 SET NAMES UTF8; 也能讀寫utf8資料了。

附3:本站提供轉換檔內容字元集工具(CCT)

,可以支援最大2Mb的檔案字元集轉換,歡迎使用。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.