標籤:
為了方便, 使用chinaunix的賬戶擷取賬戶主題. 有些網站可能需要驗證碼, 找一些不用驗證碼的網站
下面 ****** 很多個星號的均為私密資訊, 所以用星號代替
#!/usr/bin/python# -*- encoding:utf-8 -*-import urllibimport urllib2import cookielibimport reimport chardet #判斷字串編碼的包,用法為 charset.detect(str) 詳細樣本 http://www.cnblogs.com/zhanhg/p/4392089.htmlfilename = ‘cookie.txt‘#聲明一個MozillaCookieJar對象執行個體來儲存cookie,之後寫入檔案cookie = cookielib.MozillaCookieJar(filename)#handler = urllib2.HTTPCookieProcessor(Cookie)#opener = urllib2.build_opener(handler)opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cookie))postdata = urllib.urlencode({ ‘stuid‘:‘*******‘, ‘pwd‘:‘*******‘ })#登入chinaunix的url連結loginurl = ‘http://bbs.chinaunix.net/member.php?mod=logging&action=login&logsubmit=yes‘#類比登入,把cookie儲存到變數result = opener.open(loginurl,postdata)#儲存cookie到cookie.txt檔案中cookie.save(ignore_discard=True, ignore_expires=True)#查詢的連結gradeurl = ‘http://bbs.chinaunix.net/home.php?m*********************‘result = opener.open(gradeurl)html = result.read()reg = r‘<a href\=\"thread.*?" >(.*?)</a>‘a = re.findall(reg,html)for x in a: print(x.decode(‘gb2312‘))
Python入門小練習 003 利用cookielib類比登入擷取賬戶資訊