International - English

Cart Console

Topic Center

Contact Sales

首頁 > 開發者 > Python

Python網路爬蟲，在網站上扒資料__Python

最後更新：2018-07-30 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

Python做網路爬蟲其實是很方便的一件事，下面先貼出一段代碼，使用其中的網址和設定可以直接得到一些資料：

編程環境：Sublime Text

<span style="font-size:18px;"># 匯入需要用到的包，記得先安裝BeautifulSoupfrom bs4 import BeautifulSoupimport urllib2# 你需要扒資料的網站網址，timeout是溢出時間，即在timeout時間之內無法得到需要的資料就退出，屬於保護措施pagesource = urllib2.urlopen("http://www.ly.com/scenery/",timeout=8)# 讀取網站的資料sourceData = pagesource.read()siteSoup = BeautifulSoup(sourceData,"html.parser")# 資料所屬的類selectkeys = siteSoup.find_all("div",attrs={"class":"s_com_detail"})selectkeyz = siteSoup.find_all("span",attrs={"class":"s_dis"})# 輸出格式，第一個表示同時輸出多個資料，第二個表示只輸出一組資料，其中某些語句是調整格式的for plink in selectkeys:print "%s,%s,%s"% (plink.find_all("p")[0].find(text=True),plink.find_all("i")[0].find(text=True),plink.find_all("b")[0].find(text=True))for blink in selectkeyz:print blink.find(text=True)</span>

如果想扒不同網站的資料，程式中需要修改的幾處如下：

操作步驟如下：

第一步：首先獲得目標網址，開啟你要的網站直接複製網址，放在程式裡面方框1處

第二部：在網站頁面上右鍵—檢查即可開啟下面這個介面

右邊即網頁源碼，我們要從這些源碼中找資料

第三步：定位我們要下載的資料：

點擊這個按鈕：

滑鼠點一下你想下載的資料選中：

此時網頁源碼就定位在這個資料處了：

第四步：尋找資料所屬的類class

沿著定位的源碼往上找，第一個class就是這個資料所屬的類

class前後的div和detail分別對應程式裡面class前後的內容

第五步：找這個資料對應的唯一標識

圖中我們定位的資料處（即109）前後分別有<b>和</b>，所以b就是這個資料對應的唯一標識，這些網頁源碼中所有資料這類資料（價格）的標識都是b，對應程式中最後紅框裡面的內容。

至此，程式就完成了，如有不清楚的地方，歡迎指正

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

相關關鍵詞：

Python中的底線的用法介紹 01-13

python讀寫ini檔案樣本(python讀寫檔案)_python 01-19

python CMDB開發 09-19

python：發送郵件 12-08

python學習筆記2-列（list） 12-08

python學習筆記1-賦值與字串 12-08

聯繫我們

該頁面正文內容均來源於網絡整理，並不代表阿里雲官方的觀點，該頁面所提到的產品和服務也與阿里云無關，如果該頁面內容對您造成了困擾，歡迎寫郵件給我們，收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容，歡迎發送郵件至： info-contact@alibabacloud.com 進行舉報並提供相關證據，工作人員會在 5 個工作天內聯絡您，一經查實，本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

Python網路爬蟲，在網站上扒資料__Python

聯繫我們

熱門內容

熱門主題

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support