標籤:
build_opener()詳解:
1.urllib2.urlopen()函數不支援驗證、cookie或者其它HTTP進階功能,要支援這些功能,必須使用build_opener()函數建立自定這句話的Opener對象。
代碼如下:
build_Opener([handler1[handle2,...]])
參數handler是Handler執行個體,常用的有HTTPBasicAuthHandler、HTTPCookieProcessor、ProxyHandler等。
build_opener ()返回的對象具有open()方法,與urlopen()函數的功能相同。
如果要修改http前序,可以用:
import urllib2
opener = urllib2.build_opener()
opener.addheaders =[(‘User-agent‘,‘Mozilla/5.0‘)]
opener.open(‘http://www.example.com/‘)
2.install_opener(opener)
安裝不同的opener對象作為urlopen()使用的全域opener。
3. 密碼驗證(HTTPBasicAuthHandler)
HTTPBasicAuthHandler()處理常式可用add_password()來設定密碼。
4.cookie處理(HTTPCookieProcessor)
代碼如下:
import urllib2,cookielib
cookie = cookielib.CookieJar()
cookiehand = urllib2.HTTPCookieProcessor(cookie)
opener = urllib2.build_opener(cookiehand)
5. 代理(ProxyHandler)
ProxyHandler(proxies)參數proxies是一個字典,將協議名稱(http,ftp)等映射到相應Proxy 伺服器的URL。
Python urllib和urllib2模組學習(三)