標籤:server 思路 content 編輯 簡單 article dem lin target
vbs 解析html文檔的方法(htmlfile)
投稿:mdxy-dxy 字型:[增加 減小] 類型:轉載 時間:2014-06-18 我要評論
關於VBS採集,網上流行比較多的方法都是正則,其實 htmlfile 可以解析 html 代碼,但如果 designMode 沒開啟的話,有時候會包安全提示資訊
關於VBS採集,網上流行比較多的方法都是正則,其實 htmlfile 可以解析 html 代碼,但如果 designMode 沒開啟的話,有時候會包安全提示資訊。
但是開啟 designMode (@預言家晚報 分享的方法) 的話,所有js都不會被執行,只是乾乾淨淨的dom文檔,所以在逼不得已的情況下開啟 designMode 一般情況保持預設即可。
?
| 1234567891011121314 |
Set html = CreateObject("htmlfile")Set http = CreateObject("Msxml2.ServerXMLHTTP") html.designMode = "on" ‘ 開啟編輯模式 http.open "GET", "http://www.cnblogs.com/", Falsehttp.sendstrHtml = http.responseText html.write strHtml ‘ 寫入資料Set post_list = html.getElementById("post_list")For Each el In post_list.children WScript.Echo el.getElementsByTagName("a")(0).innerTextNext |
其實方法很簡單,但是重點是會vbs的,卻不一定都會 dom 操作,所以這個很糾結。
我也沒辦法,只能靠你們自己了,我只是分享一下思路而已、
這樣解析 html 比正則方便快捷多了。
vbs 解析html文檔的方法