Time of Update: 2018-12-06
今天工作的時候突然遇到個問題,就嘗試著按照領導所說要天馬行空的想東西,於是那點scrapy的代碼逐漸忘了的差不多了,想到用迅雷去下載一些東西,迅雷不知道怎麼回事,但知道一點,他監控電腦瀏覽器,那麼我想下載什麼東西的時候,可以去獲得一個遵循迅雷協議的地址,使用webbrowser模組開啟這個地址就能調用迅雷做我自己的事情了。import webbrowserwebbrowser.open('http://www.google.com.hk/')我用的是windows作業系統,關於這個模組,
Time of Update: 2018-12-06
俺希望大家能多多指教,有什麼錯誤或者不同意見請聯絡我 就事論事,直說自己遇到的情況,和我不一樣的路過吧,一樣的就看看吧 資訊抓取,用python,beautifulSoup,lxml,re,urllib2,urllib2去擷取想要抽取的頁面內容,然後使用lxml或者beautifulSoup進行解析,插入mysql
Time of Update: 2018-12-06
今天安裝了Debian5,沒想到基礎安裝的情況下居然會有python,於是安裝試試這個傳說中的語言。下面通過一系列簡單樣本來體驗,代碼可以直接粘貼儲存,都通過測試。我參照pdf學習的,大家可以從這個地址下載pdf檔案. 案例1: #用於注釋,但第一行#!也給程式指出本代碼是靠/usr/bin/python執行的,所以檔案名稱可以不是py如果你樂意,你可以給helloworld.py 增加屬性X,這樣你可以把它改成任意的檔案名稱直接執行,如hello。 Code highlighting
Time of Update: 2018-12-06
Module:mymodule.pyCode highlighting produced by Actipro CodeHighlighter
Time of Update: 2018-12-06
樣本1:LIST取得list長度len(list),向list追加元素list.append(),list排序list.sort(),刪除list元素 del list[index] 代碼Code highlighting produced by Actipro CodeHighlighter
Time of Update: 2018-12-06
python裡面list列表中extend和append的比較What's the difference? If you append a list to another list, you add the new list as a single extra list to the original, thus makingthe original list just one longer with an item that is itself a list. But if you
Time of Update: 2018-12-06
Python中知識點筆記Wentao Sun. Nov.14, 2008 來這個公司11個月了,最開始來的一個筆記本用完了,裡面都是工作時記錄的一些片段,看到一塊自己當時學/寫 python程式時記錄的筆記,決定放到網上,供大家參考。 1. sys.prefix sys模組中的perfix屬性工作表示的是C:\Program files\python25,即python的安裝路徑;2. python對一個module或軟體包安裝的方法是:python setup.py
Time of Update: 2018-12-06
基礎知識準備:1.linux下的export命令?在shell中輸入export,執行如下:[newweb@localhost //]$ exportdeclare -x BOOST_ROOT="/usr/local/boost"declare -x CLASSPATH=".:/usr/local/jdk/lib"declare -x CVS_RSH="ssh"declare -x G_BROKEN_FILENAMES="1"declare -x
Time of Update: 2018-12-06
1.Python 檔案處理今天發現在Mac OS X上進行檔案處理時,三種模式'r', 'w'('r+', 'w+'),'a'.在Mac上進行append時,必須使用'a'模式,以前好像用'w+'也可以的.f.close()的作用相當於最後的存檔。壓縮檔: import os import zipfile import time # 壓縮目錄 source_dir= r'F:web' # 按時間組建檔案名稱 target_file = time.strftime('%Y%m%d%H%M%S')
Time of Update: 2018-12-06
Python日期/時間操作方法使用 0. 模組:import os, sysimport time, datetime1. 得到目前時間(1) Based on time module:import os, sys, time, datetimestartTime = time.localtime()注意這裡: startTime<type 'time.struct_time'>(2) Based on datetime module:import os, sys, time,
Time of Update: 2018-12-06
啟動瀏覽器:self.selenium = selenium("localhost", 4444, "*firefox", "http://218.108.8.83:2048") 開啟根頁面:sel.open("/") 等待元素出現:def waitForElement(self, elementName):for i in range(60):try:if self.selenium.is_element_present(elementName): breakexcept: passtime.
Time of Update: 2018-12-06
想使用Regex來擷取一段文本中的任一字元,寫出如下匹配規則: (.*) 結果運行之後才發現,無法獲得換行之後的文本。於是查了一下手冊,才發現Regex中,“.”(點符號)匹配的是除了分行符號“\n”以外的所有字元。以下為正確的Regex匹配規則: ([\s\S]*) 同時,也可以用 “([\d\D]*)”、“([\w\W]*)” 來表示 字元 描述 \ 將下一個字元標記為一個特殊字元、或一個原義字元、或一個 反向參考、或一個八進位轉義符。例如,'n' 匹配字元 "n"。'\n'
Time of Update: 2018-12-06
1. Python正則式的基本用法 1.1基本規則 1.2重複 1.2.1最小匹配與精確匹配 1.3前向界定與後向界定 1.4組的基本知識 2. re模組的基本函數 2.1使用compile加速 2.2 match和search 2.3 finditer 2.4 字串的修改與替換 3. 更深入的瞭解re的組與對象 3.1編譯後的Pattern對象 3.2 組與Match對象 3.2.1組的名字與序號 3.2.2 Match對象的方法 4. 更多的資料
Time of Update: 2018-12-06
要使用py2exe,首先要編寫一個編譯指令碼,然後通過Python運行編譯指令碼即可將其他的指令碼編譯成可執行檔。以下執行個體是將要編譯成可執行檔的指令碼。 #file: MessageBox.pyimport win32apiimport win32conwin32api.MessageBox(0, 'hi!', 'Python', win32con.MB_OK)以下執行個體是編譯指令碼。 #file: setup.pyimport distutilsimport
Time of Update: 2018-12-06
編碼問題一直是很頭痛的問題: 當字串是:'\u4e2d\u56fd' >>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")>>>print str中國 當字串是:' 东亚学团一
Time of Update: 2018-12-06
文章目錄 4個主要的組件記錄層級logging.basicConfig([**kwargs]):logging.setLoggerClass(klass)logging.getLoggerClass()logging.getLevelName(lvl)logging.shutdown()Logger.exception(msg[, *args]) Logger.addFilter(filt) Logger.removeFilter(filt)
Time of Update: 2018-12-06
#!/usr/bin/python#-*-coding:utf-8-*- # 簡易採集爬蟲# 1.採集Yahoo!Answers,parseData函數修改一下,可以採集任何網站# 2.需要sqlite3或者pysqlite支援# 3.可以在DreamHost.com空間上面運行# 4.可以修改User-Agent冒充搜尋引擎蜘蛛# 5.可以設定暫停時間,控制採集速度# 6.採集Yahoo會被封IP數小時,所以這個採集用處不大# Author: Lukin&
Time of Update: 2018-12-06
IPython 的資料輸入(data-entry)的特徵是Tab自動完成功能,該功能在預設狀態下是開啟的。標準Python shell 編譯時間需要曾加 readline 支援特性,將具有自動完成功能,但需要輸入以下命令:載入rlcompleter和readline 。>>>import rlcompleter,readline>>>readline.parse_and_bind('tab:
Time of Update: 2018-12-06
當url地址含有中文,或者參數有中文的時候,這個算是很正常了,但是把這樣的url作為參數傳遞的時候(最常見的callback),需要把一些中文甚至′/’做一下編碼轉換。 一、urlencode urllib庫裡面有個urlencode函數,可以把key-value這樣的索引值對轉換成我們想要的格式,返回的是a=1&b=2這樣的字串,比如:>>> from urllib import urlencode>>> data = {... 'a':
Time of Update: 2018-12-06
代碼Code highlighting produced by Actipro CodeHighlighter