如何將gbk編碼轉成utf8格式
來源:互聯網
上載者:User
編碼 apache 字元集 GB 2312
mysql 字元集 GBK
現要從 mysql 中提出資訊(GBK) 寫入到 XML 中
XML中的編碼格式是 UTF-8
那麼,如何將GBK編碼成 UTF8 ??
詳細介紹:
前一陣子見到了qiushuiwuhen君的關於gbk,unicode,big5的轉換的文章
但是多少有一些不太大的問題
於是我設計了一個負責字元轉換的類,修正了其中的一些不足,增加了部分功能,以後我會不斷擴充該類,來支援更多的字元集
增加了如下幾點:
unicode->gbk 符號部分的轉換
歐元符(€)的識別
big5,Unicode,GBK之間的相互轉換,前提是只轉換共同的字元集部分,
使用說明:
暫時程式支援以下字元編碼方式:
GBK,BIG5,UTF-16BE(Unicode big-endian位元組順序),UTF-16LE(Unicode little-endian位元組順序),UTF-8
預設輸入編碼方式為GBK,預設輸出編碼方式為UTF-16BE;
該類別提供兩個函數用來修改輸入和輸出編碼方式:
修改輸入編碼方式 boolean SetGetEncoding(string $GetEncoding)
修改輸出編碼方式 boolean SetToEncoding(string $ToEncoding)
函數參數只能使用上述5種編碼方式,區分大小寫,如GBK不能寫成gbk
如果設定成功,返回true,如果使用了錯誤的編碼名,返回false,並現實錯誤資訊
函數
string EncodeString(string $String)
負責進行字元編碼轉換,返迴轉換後的字串
使用前,請將var $FilePath=\"\"變數該為該程式檔案的絕對路徑,否則將會找不到資料檔案
例子:
將gbk編碼的字串轉化為UTF-8編碼:
$s=\"GBK編碼\";
$CharEncoding=new Encoding();
$CharEncoding->SetGetEncoding(\"GBK\")||die(\"編碼名錯誤\");
$CharEncoding->SetToEncoding(\"UTF-8\")||die(\"編碼名錯誤\");
echo $CharEncoding->EncodeString($s);
在瀏覽器中使用UTF-8編碼察看,將會看到正確的字元.
附件: encoding.zip