Time of Update: 2015-05-04
標籤:爬蟲 程式設計語言 Regex python 今天第一次寫爬蟲,感覺非常有趣!,中途也遇到了許多問題,所以寫篇部落格~目標:爬取豆瓣編程類書籍中9分以上的剛接觸爬蟲,說下我的認識(不一定準確^_^)我們知道網頁的呈現也是用程式設計語言寫出來的,有源碼,每個網頁我們都可以查看它的源碼,我的瀏覽器快速鍵是Ctrl+U,一般點擊右鍵就可以看見查看源碼。因
Time of Update: 2015-05-04
標籤:參考學習地址:http://www.iplaypython.com # coding:utf-8# 學習1 import urllib.request # print(dir(html)) # 擷取網頁所在的header資訊 url="http://www.iplaypython.com/" html=urllib.request.urlopen(url)# 擷取網站返回的狀態代碼 code = html.getcode() print("返回的狀態代碼: %s" % code)if
Time of Update: 2015-05-04
標籤:1.有道的翻譯網頁: www.youdao.comFig1Fig2 Fig3Fig4再次點擊"自動翻譯"->選中‘Network‘->選中‘第一項‘,如下:Fig5然後顯示出如下內容,紅框畫出的部分是等會編寫代碼需要的地方:Fig6Fig7再看看翻譯的結果:Fig82.python實現英譯漢:原理:把需要翻譯的內容輸入給有道詞典,然後通過程式把翻譯的結果爬下來。 1 # -*- coding:utf-8 -*- 2 """ 3 Created on
Time of Update: 2015-05-04
標籤:轉自:http://blog.csdn.net/sruru/article/details/7790436以前沒有深入考慮過raw_input與input函數的區別,所以一直比較困惑,今天測試之後,有了較為深入瞭解,記錄如下>>> user = raw_input("Enter your name:")Enter your name:scr>>> user‘scr‘>>> user = raw_input("Enter your
Time of Update: 2015-05-04
標籤:python 密碼 Caesar演算法是最簡單的加解密演算法...# Caeser Cipherimport sys,osMyCypher = 25MyDict = 'ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz `[email protected]#$%^&*()_+[]\\;\',./{}|:"<>?
Time of Update: 2015-05-04
標籤:Import os; -- Python內建print(os.getcwd()) -- 獲得當前工作目錄os.chdir(‘/Users/longlong/Documents‘) -- 轉換到/Users/longlong/Documents目錄os.path.join(parm1, parm2,...) -- 從一個或多個路徑片段中構造一個路徑名。os.path.expanduser() --
Time of Update: 2015-05-04
標籤:python ubuntu 在Ubuntu下安裝Python模組通常可以使用apt-get和pip命令。apt-get命令是Ubuntu內建的包管理命令,而pip則是Python安裝擴充模組的工具,通常pip會下載擴充模組的原始碼並編譯安裝。Ubuntu 12.04中預設安裝了Python2.7.3,首先通過下面的命令安裝pip,pip是Python的一個安裝和管理擴充庫的工具。sudo apt-get install
Time of Update: 2015-05-04
標籤:python str re Regex http://blog.csdn.net/pipisorry/article/details/45476817 Python除了 str 對象內建的一些方法外,re文文書處理能力也很強大。Python中逸出字元 Regex使用反斜線" \
Time of Update: 2015-05-03
標籤:Python has become immensely popular in the modern IT world. The language is most popular for its efficiency. It is also known as the best beginner’s learning language. The prime reason why Python has become so popular is because of the simplistic
Time of Update: 2015-05-04
標籤:例一:import weburls= (‘/(.*)‘,‘index‘) app= web.application(urls,globals())class index: def GET(self, name): if not name: name = ‘world‘ web.header(‘Content-Type‘,‘text/html; charset=UTF-8‘) return ‘python web
Time of Update: 2015-05-04
標籤:起因 在開發項目過程中,為了方便調試代碼,經常會向stdout中輸出一些日誌,預設的這些日誌就直接顯示在了終端中。而一般的應用伺服器,第三方庫,甚至伺服器的一些通告也會在終端中顯示,這樣就攪亂了我們想要的資訊。解決 我們可以通過對有用的資訊設定不同顏色來達到醒目的效果,因為我平時都是在linux下開發,而linux終端中的顏色是用逸出序列控
Time of Update: 2015-05-04
標籤:字串操作:字串的 % 格式化操作:str = "Hello,%s.%s enough for ya ?"values = (‘world‘,‘hot‘)print str % values輸出結果: Hello,world.hot enough for ya ?模板字串:#coding=utf-8from string import Template## 單個變數替換s1 = Template(‘$x, glorious $x!‘)print s1.substitute(x =
Time of Update: 2015-05-03
標籤:使用Python訪問網頁主要有三種方式: urllib, urllib2, httpliburllib比較簡單,功能相對也比較弱,httplib簡單強大,但不支援session 1. 最簡單的頁面訪問(擷取伺服器端的Response包)res=urllib2.urlopen(url)print res.read() 2. 加上要GET或POST的資料data={"name":"hank",
Time of Update: 2015-05-03
標籤:if __name__==‘__main__‘:用法:當我們在命令列運行模組檔案時,Python解譯器把一個特殊變數__name__置為__main__,而如果在其他地方匯入該hello模組時,if判斷將失敗,因此,這種if測試可以讓一個模組通過命令列運行時執行一些額外的代碼,最常見的就是運行測試。if __name__==‘__main__‘: test()範圍在一個模組中,我們可能會定義很多函數和變數,但有的函數和變數我們希望給別人使用,有的函數和變數我們希望僅僅在模組內部使用。
Time of Update: 2015-05-03
標籤:python commands system popen subprocess1、os.system()此方法執行的外部程式,會將結果直接輸出到標準輸出。os.system的返回結果為執行shell 的 $? 值。因此請執行沒有輸出結果的程式時適合使用此方法。如touch 、rm
Time of Update: 2015-05-03
標籤:python 回應時間 並發訪問
Time of Update: 2015-05-03
標籤: 從開始著手SIM的研究已經將近一個月了,總算功夫不負有心人,好歹在SIM上增加了對python程式的支援。現在回過頭來想想,真正需要自己動手去編寫的代碼還是非常有限的,大多時間都是對HUSTOJ代碼不熟悉而消耗了。
Time of Update: 2015-05-03
標籤:python web-server simplehttp web服務 1. Web 服務應用工作機制監聽80或者是443連接埠 80為普通的http協議,443為https。等待用戶端請求 GET、POST、HEAD… …處理請求 儲存檔案執行CGI指令碼2.
Time of Update: 2015-05-03
標籤:milang python 本函數用來計算可迭代對象iterable的和,然後以這個結果再加上start的值。參數start用來指定相加的參數,如果沒有設定這個值,預設是0值。要計算和的序列一般是數字類型,並且開始參數要設定為數字類型。其它有些情況之下,使用別的計算和的方式會更好,比如計算字串的和使用’’.join(sequence);或者計算浮點數的和使用math.fsum();或者計算多序列的和使用itertools.
Time of Update: 2015-05-03
標籤:http://www.cnblogs.com/huxi/archive/2010/12/05/1897271.html1. 字元編碼簡介1.1. ASCIIASCII(American Standard Code for Information Interchange),是一種單位元組的編碼。電腦世界裡一開始只有英文,而單位元組可以表示256個不同的字元,可以表示所有的英文字元和許多的控制符號。不過ASCII只用到了其中的一半(\x80以下),這也是MBCS得以實現的基礎。1.2.