標籤:
一、urllib其它函數
前面介紹了 urllib 模組,以及它常用的 urlopen() 和 urlretrieve()函數的使用介紹。當然 urllib 還有一些其它很有用的輔助方法,比如對 url 進行編碼、解碼等等。
輔助方法:
1. urllib.quote(string[,safe]) : 對字串進行編碼,參數safe指定了不需要編碼的字元;
urllib.unquote(string): 對字串進行解碼;
2. urllib.urlencode(query[,doseq]): 將dict或都包含兩個元素的元組列錶轉換成url參數。
例如:
>>> dict1 = {‘name‘:‘baidu‘,‘Local‘:‘CD‘}
>>> data = urllib.urlencode(dict1)
>>> print data
Local=CD&name=baidu
3. urllib.pathname2url(path): 將本地path轉換成url路徑
urllib.url2pathname(path): 將url路徑轉換成本地路徑
二、urllib與urllib2的區別:
urllib 和 urllib2 都是接受URL請求的相關模組,但是提供了不同的功能。兩個最顯著的不同如下:
- urllib2可以接受一個Request類的執行個體來設定URL請求的headers,urllib僅可以接受URL。這意味著,你不可以偽裝你的User Agent字串等。
- urllib提供urlencode方法用來GET查詢字串的產生,而urllib2沒有。這是為何urllib常和urllib2一起使用的原因。
三、urllib2常用函數:
1.urllib2.urlopen()方法
即可以接受一個字串型的 url 地址或者一個 Request 對象。將開啟這個 url 並返回結果為一個像檔案對象一樣的對象
Python urllib和urllib2模組學習(二)