python分布式爬蟲css選取器

來源:互聯網
上載者:User

標籤:ons   技術   alt   固定   text   rip   log   ide   strong   

css選取器:

 

excract_first  如果數組為空白會拋出異常 用了這個函數之後,就不存在異常,如果提取不到就為空白

 

 

 

提取出 標題:

======================================================================

:: 是css固定用法 用來提取內容

response.css(‘.entry-header h1::text‘).extract()[0]

 

>>> response.css(‘p.entry-meta-hide-on-mobile::text‘).extract()[0]‘\r\n\r\n            2017/02/18 ·  ‘>>> response.css(‘p.entry-meta-hide-on-mobile::text‘).extract()[0].strip()‘2017/02/18 ·‘>>> response.css(‘p.entry-meta-hide-on-mobile::text‘).extract()[0].strip().replace(‘·‘, ‘ ‘)‘2017/02/18  ‘

 

 

>>> response.css(‘.vote-post-up h10::text‘).extract()[‘2‘]

response.css(‘a[href="#article-comment"] span::text‘).extract()[0]‘ 7 評論‘

完整代碼

 

 

python分布式爬蟲css選取器

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.