[python][爬蟲]暴漫gif下載

來源:互聯網
上載者:User

標籤:python   爬蟲   

說明:和上一個下載百度貼吧圖片差不多,修改了正則,加入了頁碼控制;
此外也加入了輸出格式控制,如果想加入手動設定儲存路徑功能,可以參考之前的百度貼吧爬蟲

#!/usr/bin/env python#! -*- coding: utf-8 -*-#圖片地址範例:src="http://ww2.sinaimg.cn/large/005Yan1vjw1erf95qkbfog307e08uu0y.gif" style="width:460px"import urllib,urllib2import re#返回網頁原始碼def getHtml(url, page):    tempUrl = url + str(page)    print tempUrl    html = urllib2.urlopen(tempUrl)    srcCode = html.read()    return srcCodedef getImg(url, start_page, end_page):    #對網頁中圖片建立正則    pattern = re.compile(r‘src="(.*?\.gif)".*?style="width:460px"‘)    for x in xrange(start_page, end_page+1):        srcCode = getHtml(url,x)        #圖片完整路徑儲存為list        imgSrc = pattern.findall(srcCode)        num = 0        for i in imgSrc:            urllib.urlretrieve(i,‘P%s0%s.gif‘ %(x ,num))            num += 1            print "正則下載"            print i    print ‘全部任務完成!‘#----------- 程式的入口處 -----------print u"""程式開始運行#=========================================================#   程式:暴漫爬蟲#   版本:V0.1#   江前雲後#   語言:Python 2.7#   操作:輸入要下載的暴漫gif的頁碼範圍,自動下載所有gif圖#========================================================="""#測試urlmyUrl = ‘http://baozoumanhua.com/gif/hot/page/‘start_page = int(raw_input(u"輸入起始頁\n"))end_page = int(raw_input(u"輸入結束頁\n"))getImg(myUrl, start_page, end_page)

[python][爬蟲]暴漫gif下載

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.