用asp自動解析網頁中的圖片地址

來源:互聯網
上載者:User
網頁

  現在基於WEB頁的HTML的編輯器在新聞系統,文章系統中用得越來越廣,一個網頁一粘就可以保持原來的樣式,同時圖片也可以在這個頁中保持。但是在使用過程中,如果所粘貼頁中的圖片被刪除,就會在自己的頁面上留下一個大大的“X”,影響美觀。以前只好把這個圖片儲存下來,再重新上傳到伺服器上,這樣實在麻煩。能不能讓伺服器自動去下載圖片儲存在伺服器並且替換頁面上的連結?答案是肯定的。

  要實現這個功能需要經過三個步驟:

  一,取得原頁中的圖片的地址。

  方法很多,可以用分割字串,也可以用正則匹配。實踐證明用正則匹配最為簡單。經過分析圖片的地址都儲存在<IMG>標籤中。我們可以先取得所有這個標籤。過程如下:
Set objRegExp = New Regexp'設定設定物件
objRegExp.IgnoreCase = True’忽略大小寫
objRegExp.Global = True’設定為全文檢索搜尋
objRegExp.Pattern = "<IMG.+?>"'為了確保能準確地取出圖片地址所以分為兩層配置:首先找到裡面的<IMG>標籤,然後再取出裡面的圖片地址後面的getimgs函數就是實現後一個功能的。
strs=trim(str)
Set Matches =objRegExp.Execute(strs)’開始執行配置
For Each Match in Matches
?RetStr = RetStr &getimgs( Match.Value )’執行第二輪的匹配
Next

所有的圖片在裡面都是這樣的src="http://圖片的地址",所以可以這樣來取得確切的圖片地址:
function getimgs(str)
getimgs=""
Set objRegExp1 = New Regexp
objRegExp1.IgnoreCase = True
objRegExp1.Global = True
objRegExp1.Pattern = "http://.+?"""’取出裡面的地址
set mm=objRegExp1.Execute(str)
For Each Match1 in mm
getimgs=getimgs&"||"&left(Match1.Value,len(Match1.Value)-1)’把裡面的地址串起來備用
next
end function

取得了所有的圖片的地址,我們就可以進行第二步的操作了。

  二,下載圖片並儲存在伺服器上。

  這個又可以分為兩個步驟:一個是取得圖片的內容,另一個是儲存在伺服器上。取得圖片的內容是通過下面的函數來實現的:
function getHTTPPage(url)
on error resume next
dim http
set http=server.createobject("MSXML2.XMLHTTP")‘使用xmlhttp的方法來獲得圖片的內容
Http.open "GET",url,false
Http.send()
if Http.readystate<>4 then
exit function
end if
getHTTPPage=Http.responseBody
set http=nothing
if err.number<>0 then err.Clear
end function
取得了圖片的內容要儲存,給人一種感覺是用FSO來作就可以了,但實際上不行,這樣儲存程式就會出錯,因為FSO不支援流式的檔案,所以我們要調用另一個對象:ADO.STREM。具體的過程如下:
function saveimage(from,tofile)
dim geturl,objStream,imgs
geturl=trim(from)
imgs=gethttppage(geturl)'取得圖片的具休內容的過程
Set objStream = Server.CreateObject("ADODB.Stream")'建立ADODB.Stream對象,必須要ADO 2.5以上版本
objStream.Type =1'以二進位模式開啟
objStream.Open
objstream.write imgs'將字串內容寫入緩衝
objstream.SaveToFile server.mappath(tofile),2'-將緩衝的內容寫入檔案
objstream.Close()'關閉對象
set objstream=nothing
end function
所以只要用一個迴圈來把剛才取得的地址中的圖片全部儲存下來,具體過程如下:
arrimg=split(retstr,"||")'分割字串,取得裡面地址清單
allimg=""
newimg=""
for i=1 to ubound(arrimg)
if arrimg(i)<>"" and instr(allimg,arrimg(i))<1 then'看這個圖片是否已經下載過
fname=baseurl&cstr(i&mid(arrimg(i),instrrev(arrimg(i),".")))
saveimage(arrimg(i),fname)‘儲存地址的函數,過程見上面
allimg=allimg&"||"&arrimg(i)'把儲存下來的圖片的地址串回起來,以確定要替換的地址
newimg=newimg&"||"&fname'把本地的地址串回起來
end if
next

  第三步就是替換原來的地址了。

具體的過程就是下面了:
arrnew=split(newimg,"||")'取得原來的圖片地址清單
arrall=split(allimg,"||")'取得已經儲存下來的圖片的地址清單
for i=1 to ubound(arrnew)'執行迴圈替換原來的地址
strs=replace(strs,arrall(i),arrnew(i))
next
cctv=strs
講到這裡,這個函數的基本過程就是這樣了,當然可以對它進行改造就可以實現更多的功能,如:加上圖片大小的限制,加上對本地機上的圖片下載的限制,以免造成重複下載圖片。同時也應該看到這個函數的不足之處是只能處理靜態圖片檔案,不能適用程式產生的圖片。



相關文章

Beyond APAC's No.1 Cloud

19.6% IaaS Market Share in Asia Pacific - Gartner IT Service report, 2018

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。