標籤:python
曾靈敏 — MAY 18, 2015
Python是一門優秀的語言,它能讓你在短時間內通過極少量代碼就能完成許多操作。不僅如此,它還輕鬆支援多任務處理,比如多進程。
不喜歡Python的人經常會吐嘈Python運行太慢。但是,事實並非如此。嘗試以下六個竅門,來為你的Python應用提速。
竅門一:關鍵代碼使用外部功能包
Python簡化了許多編程任務,但是對於一些時間敏感的任務,它的表現經常不盡人意。使用C/C++或機器語言的外部功能包處理時間敏感任務,可以有效提高應用的運行效率。這些功能包往往依附於特定的平台,因此你要根據自己所用的平台選擇合適的功能包。簡而言之,這個竅門要你犧牲應用的可移植性以換取只有通過對底層主機的直接編程才能獲得的運行效率。以下是一些你可以選擇用來提升效率的功能包:
Cython
Pylnlne
PyPy
Pyrex
這些功能包的用處各有不同。比如說,使用C語言的資料類型,可以使涉及記憶體操作的任務更高效或者更直觀。Pyrex就能協助Python延展出這樣的功能。Pylnline能使你在Python應用中直接使用C代碼。內聯代碼是獨立編譯的,但是它把所有編譯檔案都儲存在某處,並能充分利用C語言提供的高效率。
竅門二:在排序時使用鍵
Python含有許多古老的定序,這些規則在你建立定製的排序方法時會佔用很多時間,而這些排序方法運行時也會拖延程式實際的運行速度。最佳的排序方法其實是儘可能多地使用鍵和內建的sort()方法。譬如,拿下面的代碼來說:
import operatorsomelist = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]somelist.sort(key=operator.itemgetter(0))somelist#Output = [(1, 5, 8), (6, 2, 4), (9, 7, 5)]somelist.sort(key=operator.itemgetter(1))somelist#Output = [(6, 2, 4), (1, 5, 8), (9, 7, 5)]somelist.sort(key=operator.itemgetter(2))somelist#Output = [(6, 2, 4), (9, 7, 5), (1, 5, 8)],
在每段例子裡,list都是根據你選擇的用作關鍵參數的索引進行排序的。這個方法不僅對數實值型別有效,還同樣適用於字串類型。
竅門三:針對迴圈的最佳化
每一種程式設計語言都強調最佳化的迴圈方案。當使用Python時,你可以藉助豐富的技巧讓迴圈程式跑得更快。然而,開發人員們經常遺忘的一個技巧是:盡量避免在迴圈中訪問變數的屬性。譬如,拿下面的代碼來說:
lowerlist = [‘this‘, ‘is‘, ‘lowercase‘]upper = str.upperupperlist = []append = upperlist.appendfor word in lowerlist: append(upper(word)) print(upperlist) #Output = [‘THIS‘, ‘IS‘, ‘LOWERCASE‘]
每次你調用str.upper, Python都會計算這個式子的值。然而,如果你把這個求值賦值給一個變數,那麼求值的結果就能提前知道,Python程式就能運行得更快。因此,關鍵就是儘可能減小Python在迴圈中的工作量。因為Python解釋執行的特性,在上面的例子中會大大減慢它的速度。
(注意:最佳化迴圈的方法還有很多,這隻是其中之一。比如,很多程式員會認為,列表推導式是提高迴圈速度的最佳方法。關鍵在於,最佳化迴圈方案是提高應用程式運行速度的上佳選擇。)
竅門四:使用較新的Python版本
如果你在網上搜尋Python,你會發現數不盡的資訊都是關於如何升級Python版本。通常,每個版本的Python都會包含最佳化內容,使其運行速度優於之前的版本。但是,限制因素在於,你最喜歡的函數庫有沒有同步更新支援新的Python版本。與其爭論函數庫是否應該更新,關鍵在於新的Python版本是否足夠高效來支援這一更新。
你要保證自己的代碼在新版本裡還能運行。你需要使用新的函數庫才能體驗新的Python版本,然後你需要在做出關鍵性的改動時檢查自己的應用。只有當你完成必要的修正之後,你才能體會新版本的不同。
然而,如果你只是確保自己的應用在新版本中可以運行,你很可能會錯過新版本提供的新特性。一旦你決定更新,請分析你的應用在新版本下的表現,並檢查可能出問題的部分,然後優先針對這些部分應用新版本的特性。只有這樣,使用者才能在更新之初就覺察到應用效能的改觀。
竅門五:嘗試多種編碼方法
每次建立應用時都使用同一種編碼方法幾乎無一例外會導致應用的運行效率不盡人意。可以在程式分析時嘗試一些實驗性的辦法。譬如說,在處理字典中的資料項目時,你既可以使用安全的方法,先確保資料項目已經存在再進行更新,也可以直接對資料項目進行更新,把不存在的資料項目作為特例分開處理。請看下面第一段代碼:
n = 16myDict = {}for i in range(0, n): char = ‘abcd‘[i%4] if char not in myDict: myDict[char] = 0 myDict[char] += 1 print(myDict)
當一開始myDict為空白時,這段代碼會跑得比較快。然而,通常情況下,myDict填滿了資料,至少填有大部分資料,這時換另一種方法會更有效率。
n = 16myDict = {}for i in range(0, n): char = ‘abcd‘[i%4] try: myDict[char] += 1 except KeyError: myDict[char] = 1 print(myDict)
在兩種方法中輸出結果都是一樣的。區別在於輸出是如何獲得的。跳出常規的思維模式,建立新的編程技巧能使你的應用更有效率。
竅門六:交叉編譯你的應用
開發人員有時會忘記電腦其實並不理解用來建立現代應用程式的程式設計語言。電腦理解的是機器語言。為了運行你的應用,你藉助一個應用將你所編的人類可讀的代碼轉換成機器可讀的代碼。有時,你用一種諸如Python這樣的語言編寫應用,再以C++這樣的語言運行你的應用,這在啟動並執行角度來說,是可行的。關鍵在於,你想你的應用完成什麼事情,而你的主機系統能提供什麼樣的資源。
Nuitka
是一款有趣的交叉編譯器,能將你的Python代碼轉化成C++代碼。這樣,你就可以在native模式下執行自己的應用,而無需依賴於解譯器程式。你會發現自己的應用運行效率有了較大的提高,但是這會因平台和任務的差異而有所不同。
(注意:Nuitka
現在還處在測試階段,所以在實際應用中請多加註意。實際上,當下最好還是把它用於實驗。此外,關於交叉編譯是否為提高運行效率的最佳方法還存在討論的空間。開發人員已經使用交叉編譯多年,用來提高應用的速度。記住,每一種解決辦法都有利有弊,在把它用於生產環境之前請仔細權衡。)
在使用交叉編譯器時,記得確保它支援你所用的Python版本。Nuitka支援Python2.6, 2.7, 3.2和3.3。為了讓解決方案生效,你需要一個Python解譯器和一個C++編譯器。Nuitka支援許多C++編譯器,其中包括Microsoft Visual Studio
,MinGW
和Clang/LLVM
。
交叉編譯可能造成一些嚴重問題。比如,在使用Nuitka時,你會發現即便是一個小程式也會消耗巨大的驅動空間。因為Nuitka藉助一系列的動態連結程式庫(DDLs)來執行Python的功能。因此,如果你用的是一個資源很有限的系統,這種方法或許不太可行。
結論
前文所述的六個竅門都能協助你建立運行更有效率的Python應用。但是銀彈是不存在的。上述的這些竅門不一定每次都能奏效。在特定的Python的版本下,有的竅門或許比其他的表現更好,但這有時候甚至取決於平台的差異。你需要總結分析你的應用,找到它效率低下的部分,然後嘗試這些竅門,找到解決問題的最佳方法。
本文作者系OneAPM工程師李哲 ,想閱讀更多好的技術文章,請訪問OneAPM官方技術部落格。
提高Python運行效率的六個竅門