AJAX傳遞中文字串時必須把中文字串編碼成unicode,一般會用到JS的內建函數escape().不過找到了更好的函數來確決中文字元轉換成unicode編碼的函數
代碼如下 |
複製代碼 |
function uniencode(text) { text = escape(text.toString()).replace(/\+/g, "%2B"); var matches = text.match(/(%([0-9A-F]{2}))/gi); if (matches) { for (var matchid = 0; matchid < matches.length; matchid++) { var code = matches[matchid].substring(1,3); if (parseInt(code, 16) >= 128) { text = text.replace(matches[matchid], '%u00' + code); } } } text = text.replace('%25', '%u0025'); return text; }
|
當然伺服器端要對編碼過的字串進行第二次轉碼.把字串轉換成UTF-8編碼.
代碼如下 |
複製代碼 |
function convert_int_to_utf8($intval) { $intvalintval = intval($intval); switch ($intval) { // 1 byte, 7 bits case 0: return chr(0); case ($intval & 0x7F): return chr($intval); // 2 bytes, 11 bits case ($intval & 0x7FF): return chr(0xC0 | (($intval >> 6) & 0x1F)) . chr(0x80 | ($intval & 0x3F)); // 3 bytes, 16 bits case ($intval & 0xFFFF): return chr(0xE0 | (($intval >> 12) & 0x0F)) . chr(0x80 | (($intval >> 6) & 0x3F)) . chr (0x80 | ($intval & 0x3F)); // 4 bytes, 21 bits case ($intval & 0x1FFFFF): return chr(0xF0 | ($intval >> 18)) . chr(0x80 | (($intval >> 12) & 0x3F)) . chr(0x80 | (($intval >> 6) & 0x3F)) . chr(0x80 | ($intval & 0x3F)); } } |
補充:get請求的中文亂碼問題的解決方案
一般Tocant 的url編碼是iso-8859-1(查看tocat/conf/server.xml 中的Connector 節點沒有寫URIEncoding="xxxxxx") 如下:
代碼如下 |
複製代碼 |
<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000" redirectPort="8443" /> |
如果我們在servlet 中寫如下的代碼
String username = request.getParameter("name");//name 是get 請求過來的參數,這裡已經將get請求過來的位元組碼轉化成iso-8859-1的的碼了,解碼錯誤
byte[] b = username.getBytes("iso-8859-1");//所以要重新轉化為位元組碼,再用正確的編碼方式解碼,正確編碼方式就是 jsp那個頁面的編碼方式,
代碼如下 |
複製代碼 |
username =new String(b,"GBK"); System.out.print(username ); |