用python提取百度貼吧的小說

這個部落客要是發表些關於Windows Phone開發相關方面的文章的,和 http://blog.sina.com.cn/u/2391033251 同步更新。不過今天不務正業一下,發表一段python代碼。這個程式主要功能是從百度貼吧,獲得html檔案,然後用Beautiful Soup解析html檔案,提取貼吧的文章。幹什麼的?其實是來看小說的,想做的更自動化一些的,但是python開始學沒多長時間,暫時做到這個程度了,以後有機會會考慮增強功能的。代碼如下:#-*- encoding:

用Python合并文字檔

初入某個項目,一般都要看代碼。有時候,想把代碼檔案列印下來看,不過一般代碼檔案數量都在兩位元或更多,逐一開啟、列印,確實太耗費精力了,此外,也會出現某個代碼檔案列印到紙上只佔了一兩行的情況,很浪費紙。如果可以合并到一個文字檔裡面上面這些問題就解決。於是用Python寫了個合并代碼檔案的小程式,功能還很單調,實用性不高,暫時只能對某個目錄的文字檔進行合并,沒有一些精細的判斷和處理,留作以後細化。做好後,應該有一定的使用價值。廢話少說,上代碼:import osdef

我看Python代碼縮排

這兩天python-cn郵件清單有一條thread發展的特別長,題目是《python的代碼縮排真是坑爹》(地址),樓主在一台電腦上用KOMODO寫的代碼到另一台電腦上就不能運行了,調試後才發現是代碼縮排的問題,為此樓主表示“真是火大”!而之後的回複,可想而知,批判樓主、教育樓主、鄙視樓主等的人絕不是少數(畢竟是python郵件清單,都是python開發人員、愛好者嘛)。要求嚴格的代碼縮排是python文法的一大特色,就像C語言家族(C、C++、Java、C#等等)中的花括弧一樣重要,在大多數場合

Python為Skydrive打包下載的檔案恢複原檔案名稱

下載Skydrive上的檔案夾的話,所有檔案會打包成一個zip壓縮包。不過解壓這個壓縮包以後,發現所有中文名稱的檔案都被重新命名成了類似File1.txt這樣的格式,同時會多出來一個檔案,名為“Encoding Error.txt”。這個檔案說明了下載的檔案被重新命名是Skydrive伺服器為之,檔案前三行是:Due to the limitations of the supported zip file format, the following file(s) had to be

python(5)函數裝飾器

這個還真的沒怎麼看懂,先上代碼,此代碼即為函數裝飾器的一種用法。回頭再來看一遍。#!/usr/bin/env python from time import ctime, sleep def tsfunc(func): def wrappedFunc(): print '[%s] %s() called' % ( ctime(), func.__name__) return func() return

python-unittest(3)

Running test cases from the command line with increased verbosity.It is easy to adjust the test runner to print out every test method as it is run.1. Create a new file called recipe3.py in which to store this recipe's code.2. Pick a class to test.

python(3)Regex

Regex的規則網上有一堆,先略過。對於初學者建議用vs2010中有一個python,裡面的調試功能非常好用,可以很方便的看到一切資訊。 看到其中有一條貪婪模式和非貪婪模式的區別,這個要理解起來有點難度。範例程式碼:block = re.sub(r'(.+?)', r'hello\1_void()', r'*abc.efg*')#非貪婪模式,匹配儘可能少#輸出結果block = 'hello*_void()helloa_void()hellob_void()helloc_void()hello.

python-unittest(1)

一個非常簡單的python的測試案例,取自電子書:《Python Testing Cookbook》第一章內容,裡面說的足夠簡單明了,將之摘出來,對照代碼,應該很容易理解。The basic concept of an automated unittest test case is to instantiate part of our code, subject it to operations, and verify certain results using assertions. 1.

python(4)yield函數

這個函資料說叫做函數發生器,看文檔也沒看明白,後來在網上看了一個用法,發現實際上相當於return 語句,如下代碼: def addlist(alist): for i in alist: yield i + 1取出alist的每一項,然後把i + 1塞進去。然後通過調用取出每一項:alist = [1, 2, 3, 4]for x in addlist(alist): print x,結果為:2 3 4 5這個調用非常清晰,每到yield i +

python-unittest(5)

執行多個測試套件(suites)Chaining together a suite of testsUnittest makes it easy to chain together test cases into a TestSuite. A TestSuite can be runjust like a TestCase, but it also provides additional functionality to add a single test, multipletests,

python-unittest(4)

根據不同的命令列參數進行不同代碼的單元測試。Running a subset of test case methodsSometimes it's convenient to run only a subset of test methods in a given test case. This recipewill show how to run either the whole test case, or pick a subset from the command line.1.

python-unittest(8)

將晦澀難懂的測試分解成簡單的測試本篇的目的是解說晦澀的測試不易一目瞭然,然後用一個例子將晦澀的測試案例化為簡單的測試案例,使得測試結果一目瞭然。Breaking down obscure tests into simple ones.Unittest provides the means to test the code through a series of assertions. I have often feltthe temptation to exercise many

python-unittest(2)

Setting up and tearing down a test harness.With the following steps, we will setup and teardown a test harness for each test method.1. Create a new file called recipe2.py in which to put all our code for this recipe.2. Pick a class to test. In this

python 可調用對象

compile函數允許程式員在運行時刻迅速產生代碼對象,然後就可以用exec語句或者內建函數eval 來執行這些對象或者對它們進行求值。一個很重要的觀點是:exec和eval者可以執行字串格式的Python代碼。這也是與c++等靜態語言最重要的區別。compile的三個參數都是必須的,第一參數代表了要編譯的Python代碼。第二個字串,雖然是必須的,但通常被置為空白串。最後的參數是個字串,它用來表明代碼對象的類型。有三種可能值:‘eval’ 可求值的運算式,和eval一起使用‘single’

python(6)檔案搜尋

學習python終歸要能用到,由於工作中經常牽涉到檔案批量重新命名,拷貝及指定條件搜尋,特別是後者,非常有用。先將遞迴搜尋功能實現之:#encoding=utf-8'''Created on 2012-4-30 @author: luhx''' import os newdir = ""  #遞迴搜尋函數 def search(rootdir): #dirlist = [] print rootdir dirlist = os.listdir(rootdir) 

python os.path模組學習)

官方文檔:http://docs.python.org/library/os.path.html轉載自:http://www.redicecn.com/html/Python/20110507/273.htmlos.path.abspath(path)返回path正常化的絕對路徑。>>> os.path.abspath('test.csv')'C:\\Python25\\test.csv'>>> os.path.abspath('c:\\test.csv')'

python-unittest(6)

在測試模組中定義測試套件Defining test suites inside the test module.Each test module can provide one or more methods that define a different test suite. Onemethod can exercise all the tests in a given module; another method can define a particularsubset.1.

python(1)

一直想寫個通訊協議的測試載入器,理想是每增加一條協議,測試代碼只需增加一個資料結構,即可完成從請求發送到資料返回所有資料的展示與跟蹤,反正用C++我是做不到,用java好像也沒成功,據說指令碼功能強勁,考慮到python的廣泛基礎和與C++的結合緊密,學習之,看初始教學挺簡單,希望能完成當初的願望.終於看到對象這部分了,一個關於對象的簡單的例子:class Person: def setName(self, name): self.name = name def

python struct使用

python struct模組主要內容來自轉自:http://blog.163.com/sywxf@126/blog/static/50671196201011319507710/ 簡單讀一個二進位檔案: # coding: utf-8 import structimport sysbinfile=open('test.bin','rb')buf = binfile.read()unpackIndex = 0a,b,c,d = struct.unpack_from('ifdh', buf,

python-unittest(7)

重組舊的測試代碼,使用情境,之前有一段未使用unittest的測試代碼,通過另一個封裝檔案使其運作起來,日常生活中極少用到。Retooling old test code to run inside unittest.Sometimes, we may have developed demo code to exercise our system. We don't have torewrite it to run it inside unittest. Instead, it is easy

總頁數: 2974 1 .... 211 212 213 214 215 .... 2974 Go to: 前往

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.