編碼為GB2312網站讓AJAX接收的資料顯示支援中文

來源:互聯網
上載者:User

複製代碼 代碼如下:<script>
var xmlHttp;
var BrowerType="ie";
function createXML(){
try{
xmlHttp = new ActiveXObject("Msxml2.XMLHTTP");
} catch (e){
try{
xmlHttp = new ActiveXObject("Microsoft.XMLHTTP");
}catch(e2) {
xmlHttp =false;
}
}
if (!xmlHttp && typeof XMLHttpRequest != 'undefined'){
xmlHttp = new XMLHttpRequest();
BrowerType = "ff"; //用於記錄是否Firefox,以便下面處理接收中文資料分析使用。
}
}
function querytelcode(citys){
createXML();
showState=document.getElementById("showtelcode");
xmlHttp.onreadystatechange = function(){
if (xmlHttp.readyState == 2){
showState.innerHTML = '<img src="/img/process.gif" />';
}else if (xmlHttp.readyState == 4 && xmlHttp.status == 200){
if (BrowerType=="ff"){
getLastCode=xmlHttp.responseText;//FireFox
}else{
getLastCode=gb2utf8(xmlHttp.responseBody);
}
showState.innerHTML = getLastCode;
}
}
var url='myorderAjax.asp?oid=<%=Request.QueryString("orderid")%>&cityname='+citys;
xmlHttp.open ("GET",url,true);
if (BrowerType=="ff"){
xmlHttp.overrideMimeType("text/html;charset=gb2312");//設定以gb2312編碼識別資料,只有FF支援。IE不行
}
xmlHttp.send(null);
}
function gb2utf8(data){
var glbEncode = [];
gb2utf8_data = data;
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");
var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");
t=t.split("@");
var i=0,j=t.length,k;
while(++i<j) {
k=t[i].substring(0,4);
if(!glbEncode[k]) {
gb2utf8_char = eval("0x"+k);
execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");
glbEncode[k]=escape(gb2utf8_char).substring(1,6);
}
t[i]=glbEncode[k]+t[i].substring(4);
}
gb2utf8_data = gb2utf8_char = null;
return unescape(t.join("%"));
}
</script>

以下是此篇文章全文:
XMLHttpRequest 預設是用UTF-8 傳遞資料。當服務端的返回資料是UTF-8編碼的時候,它工作得很好(開發web應用,當服務端和用戶端以及資料庫統一使用UTF-8編碼可以有效避免亂碼問題)。如果服務端設定了正確的Content-Type Response Header以及編碼資訊,那麼XmlHttpRequest也可以正確工作。
可是當使用XMLHttpRequest讀取中文網頁內容時, 如果服務端的程式沒有設定Content-Type Response Header,或者Header沒有設定編碼類別型,那麼我們訪問responseText屬性的時候就可能遭遇亂碼。如以下代碼用XMLHttpRequest擷取雅虎中國網站的星座站首頁: 複製代碼 代碼如下:xmlhttp = getXMLHttpRequest();
var url = "http://cn.astrology.yahoo.com/";;
xmlhttp.open("GET", url, true);
xmlhttp.onreadystatechange = function(){
if (xmlhttp.readyState == 4)
if (xmlhttp.status == 200)
alert(xmlhttp.responseText);
};
xmlhttp.send(null);

縱使yahoo中國這樣專業的網站,對web標準的支援還很不徹底,彈出的html源碼中充斥不符合web標準的html標籤,當然還有已預見的亂碼。
同樣遺憾的是,FireFox 和 IE 的解決方案也是南轅北轍
FireFox 做法:
FireFox 的XMLHttpRequest對象支援overrideMimeType方法,可以指定返回資料的編碼類別型,利用該方法可以解決中文亂碼,前面的代碼修改如下: 複製代碼 代碼如下:xmlhttp = getXMLHttpRequest();
var url = "http://cn.astrology.yahoo.com/";;
xmlhttp.open("GET", url, true);
xmlhttp.overrideMimeType("text/html;charset=gb2312");//設定以gb2312編碼識別資料
xmlhttp.onreadystatechange = function(){
if (xmlhttp.readyState == 4)
if (xmlhttp.status == 200)
alert(xmlhttp.responseText);
};
xmlhttp.send(null);

Internet Explorer 做法:
IE不支援overrideMimeType方法,並且只能用一種很蹩腳的方法來解決,此時需要引入一個雜交的函數: 複製代碼 代碼如下:function gb2utf8(data){
var glbEncode = [];
gb2utf8_data = data;
execScript("gb2utf8_data = MidB(gb2utf8_data, 1)", "VBScript");
var t=escape(gb2utf8_data).replace(/%u/g,"").replace(/(.{2})(.{2})/g,"%$2%$1").replace(/%([A-Z].)%(.{2})/g,"@$1$2");
t=t.split("@");
var i=0,j=t.length,k;
while(++i<j) {
k=t[i].substring(0,4);
if(!glbEncode[k]) {
gb2utf8_char = eval("0x"+k);
execScript("gb2utf8_char = Chr(gb2utf8_char)", "VBScript");
glbEncode[k]=escape(gb2utf8_char).substring(1,6);
}
t[i]=glbEncode[k]+t[i].substring(4);
}
gb2utf8_data = gb2utf8_char = null;
return unescape(t.join("%"));
}
xmlhttp = getXMLHttpRequest();
var url = "http://cn.astrology.yahoo.com/";;
xmlhttp.open("GET", url, true);
xmlhttp.onreadystatechange = function(){
if (xmlhttp.readyState == 4)
if (xmlhttp.status == 200)
alert(gb2utf8(xmlhttp.responseBody)); //注意這裡要用responseBody
};
xmlhttp.send(null);

gb2utf8函數直接解析XMLHttpRequest返回的位元據,其中要利用execScript方法來執行VBScript的函數。所以說是一個雜交的函數。感謝blueidea論壇 提供的演算法。
雖然有瞭解決的辦法,但形式醜陋,而且不符合web標準。所以應該在編程中盡量避免,如果是開發web應用,應盡量使用UTF-8編碼,或者在服務端設定正確的編碼資訊。至於以上範例,有盜取其他網站內容的嫌疑,更是不為提倡。
附一篇:討論:
原因:AJAX在接收responseText或responseXML的值的時候是按照UTF-8的格式來解碼的,如果伺服器段發送的資料不是UTF-8的格式,那麼接收responseText或responseXML的值有可能為亂碼。
解決辦法: 在伺服器指定發送資料的格式:
在jsp檔案中:
response.setContentType("text/text;charset=UTF-8");//返回的是txt文字檔
或是
response.setContentType("text/xml;charset=UTF-8");//返回的xml檔案
PHP:header('Content-Type:text/html;charset=GB2312');
ASP:Response.Charset("GB2312")
JSP:response.setHeader("Charset","GB2312");
討論:
PHP:header('Content-Type:text/html;charset=GB2312');
這樣寫除非是小項目
大項目都是按照架構走
對於HEADER定義於config檔案最前端解決方案
在JS裡有一個解析utf-8xml的方法寫的非常強
建議用那
非物理生命 traindiy

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.