在使用 ?id=”中文” 傳遞中文參數時,出現了亂碼,這是經過了二次轉碼後的結果,其中,在 php 中,url 中是不可以直接傳輸中文的,對於這點,一直心存不滿,沒辦法呀,誰讓咱沒一套解決方案呢,不知道別的語言是不是也出現這樣的問題。
對於網上所說的在首頁添加 header(“content-type:text/html;charset=utf-8″); 這樣的代碼,以及把資料庫頁面等等設定成 utf8 的解決方案根本無效,始終傳遞過來的中文是亂碼。
儘管所有 04ie.com網站PHP 我都是用的統一的 utf8 編碼,但始終傳遞過去是亂碼,後來測試了幾個瀏覽器,發現 360 可以傳遞過去,而 IE 不行,後來再使用 $msg = iconv(‘gbk’,'utf-8′,$_GET["msg"]); 進行轉換,測試幾個瀏覽器後,大多還是顯示亂碼的問題。
最後總結了一點,對於 GET[] 過去的值,url 中不可以直接傳輸中文,如果必須要傳輸的話,用 urlencode() 方法來處理中文。對於 POST[] 不知道怎麼樣,暫時還沒有做過實驗。
再來PHP手冊上查下urlencode()的使用:
urlencode() 本函數將字串以 URL 編碼。例如空格就會變成加號。Homepage 中 form 資料傳送就是用 urlencode 編碼後再送出
原來如此,我說呢為什麼從form表單提交過來的就沒有問題,但是url傳遞過來的就亂碼
本工具分別實現兩種方式的Encode與Decode:
中文 -> GB2312的Encode -> %D6%D0%CE%C4
中文 -> UTF-8的Encode -> %E4%B8%AD%E6%96%87
Html中的URLEncode:
編碼為GB2312的html檔案中:/中文.rar -> 瀏覽器自動轉換為 -> /%D6%D0%CE%C4.rar
注意:Firefox對GB2312的Encode的中文URL支援不好,因為它預設是UTF-8編碼發送URL的,但是ftp://協議可以,我試過了,我認為這應該算是Firefox一個bug。
編碼為UTF-8的html檔案中:/中文.rar -> 瀏覽器自動轉換為 -> /%E4%B8%AD%E6%96%87.rar
PHP中的URLEncode:
代碼如下 |
複製代碼 |
<?php //GB2312的Encode echo urlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.+ echo urldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_. echo rawurlencode("中文-_. ")."n"; //%D6%D0%CE%C4-_.%20 echo rawurldecode("%D6%D0%CE%C4-_. ")."n"; //中文-_. ?> |
除了“-_.”之外的所有非字母數字字元都將被替換成百分比符號“%”後跟兩位十六進位數。
urlencode和rawurlencode的區別:urlencode將空格編碼為加號“+”,rawurlencode將空格編碼為加號“%20”。
如果要使用UTF-8的Encode,有兩種方法:
一、將檔案存為UTF-8檔案,直接使用urlencode、rawurlencode即可。
二、使用mb_convert_encoding函數:
代碼如下 |
複製代碼 |
<?php $url = '/中文.rar'; echo urlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n"; echo rawurlencode(mb_convert_encoding($url, 'utf-8', 'gb2312'))."n"; //http%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar ?> |
執行個體:
代碼如下 |
複製代碼 |
<?php function parseurl($url="") { $url = rawurlencode(mb_convert_encoding($url, 'gb2312', 'utf-8')); $a = array("%3A", "%2F", "%40"); $b = array(":", "/", "@"); $url = str_replace($a, $b, $url); return $url; } $url="ftp://ud03:password@s./中文/中文.rar"; echo parseurl($url); //ftp://ud03:password@s./%D6%D0%CE%C4/%D6%D0%CE%C4.rar ?> |
JavaScript中的URLEncode:
如:%E4%B8%AD%E6%96%87-_.%20%E4%B8%AD%E6%96%87-_.%20
encodeURI不對下列字元進行編碼:“:”、“/”、“;”、“?”、“@”等特殊字元。
如:/%E4%B8%AD%E6%96%87.rarhttp%3A%2F%2Fs.%2F%E4%B8%AD%E6%96%87.rar
看來也只有用 urlencode() 方法來處理中文了,在傳遞之前要先進行編碼,傳遞過去之後再進行解決就可以了,那麼利用如下兩個函數:編碼:”.urlencode(‘中文’).”,解碼:”.urldecode(‘中文’).”,括弧裡的中文就是傳遞的字元了。
如下:傳遞頁面先進行04ie.com編碼:td.php?id=”.urlencode(‘中文’).”,接受頁面進行解碼即可:urldecode(id).”。
後來附一個函數
代碼如下 |
複製代碼 |
if (preg_match("/^([".chr(228)."-".chr(233)."]{1} [".chr(128)."-".chr(191)."]{1}[".chr(128)."-".chr(191)."]{1})+$/",$msg)) //如果$msg是UTF-8編碼 { $msg = iconv("UTF-8","GB2312",$msg); //將 $msg 由UTF-8編碼轉為GB2312編碼 }
|