標籤:llb pbc dts tyvj pem xlk mon pos osc
本篇轉自部落格:上海-悠悠
原文地址:http://www.cnblogs.com/yoyoketang/tag/python%E6%8E%A5%E5%8F%A3%E8%87%AA%E5%8A%A8%E5%8C%96/
前言
某屌絲男A鼓起勇氣向女神B打電話表白,女神B是個心機婊覺得屌絲男A是好人,不想直接拒絕於是設定來電轉接給閨蜜C了,最終屌絲男A和女神閨蜜C表白成功了,這種情境其實就是重新導向了。
一、重新導向
1. (Redirect)就是通過各種方法將各種網路請求重新定個方向轉到其它位置,從地址A跳轉到地址B了。
2.重新導向狀態代碼:
--301 redirect: 301 代表永久性轉移(Permanently Moved)
--302 redirect: 302 代表暫時性轉移(Temporarily Moved )
3.舉個簡單的情境案例,先登入部落格園開啟我的部落格首頁,進我的隨筆編輯介面,記住這個地址:https://i.cnblogs.com/EditPosts.aspx?opt=1
4.退出部落格園登入,把剛才我的隨筆這個地址輸入瀏覽器斷行符號,抓包會看到這個請求狀態代碼是302,瀏覽器地址欄瞬間重新整理跳到登入首頁去了
二、禁止重新導向(allow_redirects)
1.用get方法請求:https://i.cnblogs.com/EditPosts.aspx?opt=1
2.列印狀態代碼是200,這是因為requets庫自動處理了重新導向請求了
3.自動處理重新導向地址後,我們就擷取不到重新導向後的url了,就無法走下一步,這裡我們可以設定一個參數禁止重新導向:allow_redirects=False
(allow_redirects=True是啟動重新導向),然後就可以看到status_code是302了
三、擷取重新導向後地址
1.在第一個請求後,伺服器會下發一個新的請求連結,在response的headers裡,如下抓包:Location
2.用指令碼去擷取Location地址
四、參考代碼:
# coding:utf-8
import requests
# 要求標頭
headers = {
"User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:44.0) Gecko/20100101 Firefox/44.0"
}
s = requests.session()
# 開啟我的隨筆
r = s.get(‘https://i.cnblogs.com/EditPosts.aspx?opt=1‘,
headers=headers,
allow_redirects=True,
verify=False)
# 列印狀態代碼,自動處理重新導向請求
print r.status_code
new_url = r.headers["Location"]
print new_url
python介面自動化6-重新導向(Location)【轉載】