在Python下使用Txt2Html實現網頁過濾代理的教程

在撰寫本 developerWorks 系列文章的過程中,我曾遇到過以最佳格式進行撰寫的問題。文文書處理程式格式都是專用的,在格式之間轉換總不能盡如人意,也很麻煩(而且每種格式都會各自將文檔綁定到不同的專用工具,這種情況又與開放源碼的精神相違背)。HTML 還算中立 -- 也許您現在閱讀的文章正是這種格式 -- 但它也添加了標記,而這些標記很容易引起誤輸入(或者使人束縛於 HTML 增強型編輯器)。DocBook 是一種有趣的 XML 格式,它可以轉換成許多目標格式,並且它擁有技術文章(或書籍)

詳解Python中的文本處理

字串 -- 不可改變的序列如同大多數進階程式設計語言一樣,變長字串是 Python 中的基本類型。Python 在“後台”分配記憶體以儲存字串(或其它值),程式員不必為此操心。Python 還有一些其它進階語言沒有的字串處理功能。在 Python 中,字串是“不可改變的序列”。儘管不能“按位置”修改字串(如位元組組),但程式可以引用字串的元素或子序列,就象使用任何序列一樣。Python

Python httplib模組使用執行個體

httplib模組是一個底層基礎模組,實現的功能比較少,正常情況下比較少用到.推薦用urllib, urllib2, httplib2.HTTPConnection 對象class httplib.HTTPConnection(host[, port[, strict[, timeout[, source_address]]]]) 建立HTTPConnection對象HTTPConnection.request(method, url[, body[, headers]])

Python進程通訊之匿名管道執行個體講解

匿名管道管道是一個單向通道,有點類似共用記憶體緩衝.管道有兩端,包括輸入端和輸出端.對於一個進程的而言,它只能看到管道一端,即要麼是輸入端要麼是輸出端.os.pipe()返回2個檔案描述符(r, w),表示可讀的和可寫的.範例程式碼如下: 代碼如下:#!/usr/bin/pythonimport timeimport osdef child(wpipe): print('hello from child', os.getpid()) while True: msg =

在Python中使用SimpleParse模組進行解析的教程

與大多數程式員一樣,我經常需要標識存在於文字文件中的組件和結構,這些文檔包括:記錄檔、設定檔、分隔的資料以及格式更自由的(但還是半結構化的)報表格式。所有這些文檔都擁有它們自己的“小語言”,用於規定什麼能夠出現在文檔內。我編寫處理這些非正式解析任務的程式的方法總是有點象大雜燴,其中包括定製狀態機器、Regex以及上下文驅動的字串測試。這些程式中的模式大概總是這樣:“讀一些文本,弄清是否可以用它來做些什麼,然後可能再多讀一些文本,一直嘗試下去。”各種形式的解析器將文檔中組件和結構的描述提煉成簡明、

Python的動態重新封裝的教程

讓我們描繪一下本文的情節:假設您要在本地機器上運行一個進程,而部分程式邏輯卻在另一處。讓我們特別假設這個程式邏輯會不時更新, 而您運行進程時,希望使用最新的程式邏輯。有許多方法可以滿足剛提到的要求;本文將向您說明其中幾種方法。隨著“可愛的 Python”專欄不斷進行,已經討論了我的公用域公用程式 Txt2Html 的進行中的增強。該公用程式將“智能 ASCII”文字檔轉換成 HTML。以前的文章討論了公用程式的 Web Proxy版本和公用程式的 curses

Python中檔案操作簡明介紹

開啟檔案open函數返回一個檔案對象,基本文法:●file_object = open(file_name, access_mode='r'[,buffering=-1])file_name 是包含要開啟的檔案名稱字的字串, 它可以是相對路徑或者絕對路徑.●可選變數access_mode 也是一個字串, 代表檔案開啟的模式. 通常, 檔案使用模式 ‘r', ‘w', 或是 ‘a'模式來開啟, 分別代表讀取, 寫入和追加.●另外一個選擇性參數 buffering 用於指示訪問檔案所採用的緩衝方式.

用Python產生器實現微線程編程的教程

微線程領域(至少在 Python 中)一直都是 Stackless Python 才能涉及的特殊增強部分。關於 Stackless 的話題以及最近它經曆的變化,可能本身就值得開闢一個專欄了。但其中簡單的道理就是,在“新的 Stackless”下,延續(continuation)顯然是不合時宜的,但微線程還是這個項目 存在的理由。這一點很複雜……剛開始,我們還是先來回顧一些內容。那麼,什麼是微線程呢? 微線程基本上可以說是只需要很少的內部資源就可以啟動並執行進程 ― 並且是在 Python

Python字串處理函數簡明總結

返回被去除指定字元的字串預設去除空白字元刪除首尾字元:str.strip([char]) 刪除首字元:str.lstrip([char]) 刪除尾字元str.strip([char])判斷是否匹配首末字元匹配成功返回True,否則返回False 匹配首字元:str.startswith(char[, start[, end]]) 匹配末字元:str.endswith(char[, start[, end]])尋找字元,找到返回字元位置,否則返回-1從字串開頭尋找str.find(char[,

Python中的物件導向編程詳解(上)

建立類Python 類使用 class 關鍵字來建立。簡單的類的聲明可以是關鍵字後緊跟類名: 代碼如下:class ClassName(bases): 'class documentation string' #'類文檔字串' class_suite #類體執行個體化通過類名後跟一對圓括弧執行個體化一個類 代碼如下:mc = MyClass() # instantiate class 初始化類‘int()'構造器def __int__(self):

Python中的進階函數map/reduce使用執行個體

Python內建了map()和reduce()函數。如果你讀過Google的那篇大名鼎鼎的論文“MapReduce: Simplified Data Processing on Large Clusters”,你就能大概明白map/reduce的概念。我們先看map。map()函數接收兩個參數,一個是函數,一個是序列,map將傳入的函數依次作用到序列的每個元素,並把結果作為新的list返回。舉例說明,比如我們有一個函數f(x)=x2,要把這個函數作用在一個list [1, 2, 3, 4, 5,

Python單元測試架構unittest使用方法講解

概述1.測試腳手架(test fixture)測試準備前要做的工作和測試執行完後要做的工作.包括setUp()和tearDown().2.測試案例(test case)最小的測試單元.3.測試套件(test suite)測試案例的集合.4.測試回合器(test runner)測試執行的組件.命令列介面可以用命令列運行測試模組,測試類別以及測試方法. 代碼如下:python -m unittest test_module1 test_module2python -m unittest

Python字典操作簡明總結

1.dict()建立字典 代碼如下:>>> fdict = dict((['x', 1], ['y', 2]))>>> fdict{'y': 2, 'x': 1}2.fromkeys() 來建立一個"預設"字典,字典中元素具有相同的值 代碼如下:>>> ddict = {}.fromkeys(('x', 'y'), -1)>>> ddict{'y': -1, 'x': -1}3.遍曆字典使用keys()遍曆 代碼如下:>>> dict2 = {'name': 'earth', 'port':

在Python中使用itertools模組中的組合函數的教程

理解新概念Python V2.2 中引入了迭代器的思想。唔,這並不十分正確;這種思想的“苗頭”早已出現在較老的函數 xrange() 以及檔案方法 .xreadlines() 中了。通過引入 yield 關鍵字,Python 2.2 在內部實現的許多方面推廣了這一概念,並使編程定製迭代器變得更為簡單( yield 的出現使函數轉換成產生器,而產生器反過來又返回迭代器)。迭代器背後的動機有兩方面。將資料作為序列處理通常是最簡單的方法,而以線性順序處理的序列通常並不需要都同時實際 存在。x*()

初步介紹Python中的pydoc模組和distutils模組

pydocKa-Ping Yee 曾建立了一個相當著名的模組,名叫 pydoc (比較而言: pydoc 可以做到 perldoc 所能做的任何事,並且做得更好、更漂亮:-)。對於 Python 2.1 來說, pydoc (以及它支援的 inspect )是標準庫的一部分。而對於使用 Python 1.5.2、1.6 或者 2.0 版本的使用者來說,下載並安裝 pydoc 也很簡單 ― 請立即下載(請參閱 參考資料)。作為提供給閱讀這篇 Python 文章的任何初學者的背景資料,Python

進一步瞭解Python中的XML 工具

模組:xmllibxmllib 是一個非驗證的低級文法分析器。應用程式員使用的 xmllib 可以覆蓋 XMLParser 類,並提供處理文件項目(如特定或類屬標記,或字元實體)的方法。從 Python 1.5x 到 Python 2.0+ 以來, xmllib 的使用方法並沒變化;在絕大多數情況下更好的選擇是使用 SAX 技術,它也是種面向流的技術,對語言和開發人員來說更為標準。本文中的樣本與原來專欄中的相同:包括一個叫做 quotations.dtd 的 DTD 以及這個 DTD 的文檔

Python命令列參數解析模組optparse使用執行個體

樣本 代碼如下:from optparse import OptionParser[...]def main(): usage = "usage: %prog [options] arg" parser = OptionParser(usage) parser.add_option("-f", "--file", dest="filename", help="read data from FILENAME")

Python2.x和3.x下maketrans與translate函數使用上的不同

maketrans和translate函數是進行字串字元編碼的常用方法。本文著重點在於示範其基本用法和在不同版本下操作的差異。本文提到的2.X版本指2.6以上的版本,3.X版本指3.1以上的版本。 2.X版本把字串基本分為兩種:unicode字串和8位字串str,後者包含位元組資料和我們常見的ASCII碼資料;而3.X版本則重新對字串進行了劃分,分為了位元組字串bytes和文本字串str,兩者都是不可變的,所以添加了一個可變的位元組字串類型bytearray。

簡單介紹Python中的RSS處理

RSS 是一個可用多種擴充來表示的縮寫:“RDF 網站總覽(RDF Site Summary)”、“真正簡單的辛迪加(Really Simple Syndication)”、“豐富網站摘要(Rich Site Summary)”,也許還能用其他擴充來表示。在如此混亂的名稱背後,您會發現和這樣一個平凡的技術領域相關的故事多得令人吃驚。RSS 是用於分發 Web 網站上的內容的摘要的一種簡單的 XML 格式。它能夠用於共用各種各樣的資訊,包括(但不是 僅限於)簡訊、Web

複習Python中的字串知識點

字串在 Python 中建立字串對象非常容易。只要將所需的文本放入一對引號中,就完成了一個新字串的建立(參見清單 1)。如果稍加思考的話,您可能會感到有些困惑。畢竟,有兩類可以使用的引號:單引號 (') 和雙引號 (")。幸運的是,Python 再一次使這種問題迎刃而解。您可以使用任意一類引號來表示 Python 中的字串,只要引號一致就行。如果字串是以單引號開始,那麼必須以單引號結束,反之亦然。如果不遵循這一規則,則會出現 SyntaxError 異常。清單 1. 在 Python

總頁數: 2974 1 .... 2752 2753 2754 2755 2756 .... 2974 Go to: 前往

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.