標籤:war lan uil 特性 html5 pac link 幾分鐘 XML
Beautiful Soup是一個Python的一個庫,主要為一些短周期項目比如螢幕抓取而設計。有三個特性使得它非常強大:
1.Beautiful Soup提供了一些簡單的方法和Python術語,用於檢索和修改文法樹:一個用於解析文檔並提取相關資訊的工具包。這樣你寫一個應用不需要寫很多代碼。 2.Beautiful Soup自動將輸入文檔轉換為Unicode編碼,並將輸出文檔轉化為UTF-8編碼。你不需要考慮編碼,除非輸入文檔沒有指出其編碼並且Beautiful Soup無法自動檢測到,這時你需要指出原來的編碼方式。 3.Beautiful Soup位於一些流行的Python解析器比如lxml和html5lib的上層,這允許你使用不同的解析策略或者犧牲速度來換取靈活性。 Beautiful Soup解析你提哦那個的任何東西,並且替你完成樹的便利。你可以告訴它“尋找所有的連結” 或者“尋找類externalLink的所有連結”或者“尋找所有url地址匹配foo.com的連結”或者“尋找使用粗體的表頭,返回那些粗體的文本”。 在一些設計不良的網站上很難擷取的寶貴的資料,使用Beautiful Soup便可以獲得。 原先需要運行幾個小時工程,使用Beautiful Soup僅需要幾分鐘而已。 下面說一下在Windows下面如何安裝Beautiful Soup:1.到http://www.crummy.com/software/BeautifulSoup/網站上上下載,最新版本是4.1.3。2.下載完成之後需要解壓縮,假設放到D:/python下。3.運行cmd,切換到D:/python/beautifulsoup4-4.1.3/目錄下(根據自己解壓縮後的目錄和下載的版本號碼修改),cd /d D:/python//beautifulsoup4-4.1.34.運行命令:setup.py buildsetup.py install5.在IDE下from bs4 import BeautifulSoup,沒有報錯說明安裝成功。 ====================================================Mac安裝1、先安裝pip
wget https://pypi.python.org/packages/source/p/pip/pip-1.5.6.tar.gztar zxvf pip-1.5.6.tar.gzcd pip-1.5.6python setup.py install
2、安裝Beautifulsoup
pip install beautifulsoup4
Windows和Mac下安裝Beautiful Soup