例子,利用mb_detect_encoding()判斷字元是否為uft-8編碼。
| 代碼如下 |
複製代碼 |
| $encode = mb_detect_encoding($q, array('GB2312','GBK','UTF-8')); echo $encode."<br/>"; if($encode=="GB2312") { $q = iconv("GBK","UTF-8",$q); } else if($encode=="GBK") { $q = iconv("GBK","UTF-8",$q); } else if($encode=="EUC-CN") { $q = iconv("GBK","UTF-8",$q); } else//CP936 { //$q = iconv("GB2312","UTF-8",$q); } |
可是 mb_detect_encoding 存在一個硬傷,經常出現判斷不準確的情況。或許這樣就可以解決:
| 代碼如下 |
複製代碼 |
| // 使用 iconv 轉換並判斷是否等值,效率不高 function is_utf8 ($str) { if ($str === iconv('UTF-8', 'UTF-8//IGNORE', $str)) { return 'UTF-8'; } } // 多種編碼的情況 function detect_encoding ($str) { foreach (array('GBK', 'UTF-8') as $v) { if ($str === iconv($v, $v . '//IGNORE', $str)) { return $v; } } } |
通過以上方式得到字串編碼資訊後,就可以利用 iconv 或 mb_convert_encoding 來轉換編碼了
問題
可是當 $keytitle = '%D0%BE%C6%AC'; 時。
檢測結果卻是UTF-8,這其實不算是bug,我們不應當過於依賴mb_detect_encoding,當字串較短時,檢測結果產生偏差的可能性很大。
解決方案:
| 代碼如下 |
複製代碼 |
| $encode = mb_detect_encoding($keytitle, array('ASCII','GB2312′,'GBK’,'UTF-8'); |
x