標籤:
系統編程:提供API(Application Programming InterfaceAPI),能方便進行系統維護和管理,Linux下標誌性語言之一,是很多系統管理員理想的編程工具[5] 。
圖形處理:有PIL、Tkinter等圖形庫支援,能方便進行圖形處理。
數學處理:NumPy擴充提供大量與許多標準數學庫的介面。
文本處理:python提供的re模組能支援Regex,還提供SGML,XML分析模組,許多程式員利用python進行XML程式的開發。
資料庫編程:程式員可通過遵循Python DB-API(資料庫應用程式編程介面)規範的模組與Microsoft SQL Server,Oracle,Sybase,DB2,MySQL、SQLite等資料庫通訊。python內建有一個Gadfly模組,提供了一個完整的SQL環境。
網路編程:提供豐富的模組支援sockets編程,能方便快速地開發分布式應用程式。很多大規模軟體開發計劃例如Zope,Mnet 及BitTorrent. Google都在廣泛地使用它。
Web編程:應用的開發語言,支援最新的XML技術。
多媒體應用:Python的PyOpenGL模組封裝了“OpenGLAPI”,能進行二維和三維影像處理。PyGame模組可用於編寫遊戲軟體。
pymo引擎:PYMO全稱為python memories off,是一款運行於Symbian S60V3,Symbian3,S60V5, Symbian3, Android系統上的AVG遊戲引擎。因其基於python2.0平台開發,並且適用於建立秋之回憶(memories off)風格的AVG遊戲,故命名為PYMO。
駭客編程:python有一個hack的庫,內建了你熟悉的或不熟悉的函數,但是缺少成就感。
用Python寫簡單爬蟲
首先,要通過urllib2這個Module獲得對應的HTML源碼。
| 1234 |
import urllib2 #調用urllib2 url=‘http://www.baidu.com/s?wd=cloga‘ #把等號右邊的網址賦值給urlhtml=urllib2.urlopen(url).read() #html隨意取名 等號後面的動作是開啟原始碼頁面,並閱讀print html #列印 |
通過上面這三句就可以將URL的源碼存在content變數中,其類型為字元型。
接下來是要從這堆HTML源碼中提取我們需要的內容。用Chrome查看一下對應的內容的代碼(也可以用Firefox的Firebug)。
可以看到url的資訊儲存在span標籤中,要擷取其中的資訊可以用正則式。
python類常用