我們經常會要碰到把uft-8字元轉換在gbk或gb2312編碼,但在使用過程中轉換經常會碰到一些問題,下面我來介紹利用php內建的字串轉換函式來實現字元編碼轉換。
iconv函數的一個bug。iconv在轉換字元”—”到gb2312時會出錯
解決方案很簡單,就是在需要轉成的編碼後加 “//IGNORE” 也就是iconv函數第二個參數後.
如下:
以下為引用的內容:
| 代碼如下 |
複製代碼 |
iconv(“UTF-8″,”GB2312//IGNORE”,$data)
|
ignore的意思是忽略轉換時的錯誤,如果沒有ignore參數,所有該字元後面的字串都無法被儲存。
這個iconv()這個函數,在php5中是內建的.
列子
| 代碼如下 |
複製代碼 |
echo $str= '你好,這裡是賣咖啡!'; echo ' '; echo iconv('GB2312', 'UTF-8', $str); //將字串的編碼從GB2312轉到UTF-8 echo ' '; echo iconv_substr($str, 1, 1, 'UTF-8'); //按字元個數截取而非位元組 print_r(iconv_get_encoding()); //得到當前頁面編碼資訊 echo iconv_strlen($str, 'UTF-8'); //得到設定編碼的字串長度 //也有這樣用的 $content = iconv("UTF-8","gbk//TRANSLIT",$content); ?> |
但是使用iconv函數可能會碰到如notice: iconv() [function.iconv]: detected an illegal character in input string ...錯誤了,
原因是因為這個編碼範圍的問題,gb2312小於gbk小於uft8哦,所以大家轉換時要注意了,不過我們php還提供了一個函數mb_detect_encoding他可以比較好的解決這個問題了。
現在把它寫成更專業的函數
| 代碼如下 |
複製代碼 |
function phpcharset($data, $to) { if(is_array($data)) { foreach($data as $key => $val) { $data[$key] = phpcharset($val, $to); } } else { $encode_array = array('ASCII', 'UTF-8', 'GBK', 'GB2312', 'BIG5'); $encoded = mb_detect_encoding($data, $encode_array); $to = strtoupper($to); if($encoded != $to) { $data = mb_convert_encoding($data, $to, $encoded); } } return $data; } ?> |
有時我們不知道字元的編碼這時會需要先檢測出編碼再進行轉換。
| 代碼如下 |
複製代碼 |
function asciitog($brand) { $cha=mb_detect_encoding($brand); if($cha=='utf-8') { $brand2 = iconv($cha,"gb2312",$brand); } $cha2=mb_detect_encoding($brand2); if($cha2!='ascii'){ $brand=$brand2; } return $brand; }
|
http://www.bkjia.com/PHPjc/632143.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/632143.htmlTechArticle我們經常會要碰到把uft-8字元轉換在gbk或gb2312編碼,但在使用過程中轉換經常會碰到一些問題,下面我來介紹利用php內建的字串轉換函式來...