禁止訪問非同域的網站,下面一個例子來訪問http://www.google.cn,
<script type="text/javascript">
function createobj() {
if (window.ActiveXObject) {
return new ActiveXObject("Microsoft.XMLHTTP");
}
else if (window.XMLHttpRequest) {
return new XMLHttpRequest();
}
}
function getWebPage(url) {
var oBao=createobj();
var my_url=url
oBao.open('get',my_url,false);
oBao.onreadystatechange=function(){
if(oBao.readyState==4){
if(oBao.status==200){
var returnStr=oBao.responseText;
document.write(returnStr);
}else{
document.write("未找到您輸入的地址或伺服器505錯誤!");
}
}
}
oBao.send(null);
}
getWebPage('http://www.google.cn');
</script>
儲存這段代碼到test.html,在本地直接用IE開啟沒問題,但將該段代碼上傳到伺服器後,問題出現了--JS提示"沒有許可權"錯誤!!!這該如何解決呢?
下面思考一下:既然不能訪問非同域的,只能訪問同域的地址了,同域的動態檔案怎麼擷取非同域網頁內容呢?我們還是想到的AJAX,只不過這個AJAX是在伺服器端執行.
大體思路是這樣的:首先將URL用AJAX提交給自己站內的檔案,例如getPage.asp---在getPage.asp再次通過伺服器XMLHTTP來訪問提交來的URL---將擷取的內容返回給提交URL的頁----顯示內容
下面開始組織代碼,首先是test.html檔案
<script type="text/javascript">
function createobj() {
if (window.ActiveXObject) {
return new ActiveXObject("Microsoft.XMLHTTP");
}
else if (window.XMLHttpRequest) {
return new XMLHttpRequest();
}
}
function getWebPage(url) {
var oBao=createobj();
var my_url="getpage.asp?url="+escape(url);
oBao.open('get',my_url,false);
oBao.onreadystatechange=function(){
if(oBao.readyState==4){
if(oBao.status==200){
var returnStr=oBao.responseText;
document.write(returnStr);
}else{
document.write("未找到您輸入的地址或伺服器505錯誤!");
}
}
}
oBao.send(null);
}
getWebPage('http://www.google.cn');
</script>
再就是getpage.asp檔案(注意:要以UTF-8格式儲存本檔案,防止亂碼),如下:
<%
response.charset="UTF-8"
reg="\<meta.+ charset= {0,}([^\"" \>\/]*).+\/{0,1}\>"
'函數名:GetResStr
'作用:擷取指定URL的HTML代碼
'參數:URL-要擷取的URL
function GetResStr(URL)
err.clear
dim ResBody,ResStr,PageCode,ReturnStr
Set Http=createobject("MiCROSOFT.XMLHTTP")
Http.open "GET",URL,False
Http.Send()
If Http.Readystate =4 Then
If Http.status=200 Then
ResStr=http.responseText
ResBody=http.responseBody
PageCode=GetCode(ResStr,reg)
ReturnStr=BytesToBstr(http.responseBody,PageCode)
GetResStr=ReturnStr
End If
End If
End Function
'函數名:BytesToBstr
'作用:轉換位元據為字元
'參數:Body-位元據,Cset-文本編碼方式
Function BytesToBstr(Body,Cset)
Dim Objstream
Set Objstream = CreateObject("adodb.stream")
objstream.Type = 1
objstream.Mode =3
objstream.Open
objstream.Write body
objstream.Position = 0
objstream.Type = 2
objstream.Charset =Cset
BytesToBstr = objstream.ReadText
objstream.Close
set objstream = nothing
End Function
'函數名:GetCode
'作用:轉換二進位為字元
'參數:str-待查詢字串,regstr-Regex
Function GetCode(str,regstr)
Dim Reg,serStr
set Reg= new RegExp
Reg.IgnoreCase = True
Reg.MultiLine = True
Reg.Pattern =regstr
if Reg.test(str) then '若查詢到匹配項
Set Cols = Reg.Execute(str)
serStr=Cols(0).SubMatches(0) '使用匹配到的第一個匹配項
else '否則給個預設值gb2312,有點省懶法,如果頁面沒給出編碼格式,想知道確實有點麻煩
serStr="gb2312"
end if
GetCode=serStr
end function
dim url:url=request.querystring("url")
response.write GetResStr(URL)
%>
程式碼群組織完畢,實驗下,成功提取http://www.google.cn的內容!!!!!這樣就可以解決"沒有許可權"的問題了。
其實,單純一個getpage.asp一樣能擷取,不過不能像js那樣動態處理DOM。
還有一個問題,如果你用第一種方法訪問http://www.baidu.com會出現亂碼,因為baidu編碼為GB2312,
而XMLHTTP返回的是UTF-8編碼格式。用第二種方法就不會出現這樣的問題了,只要定義了編碼格式的網站就能正常返回資訊(這裡不能包括一些使用特別編碼的網站)。