Python 效能最佳化技巧總結,python效能最佳化技巧
1.使用測量工具,量化效能才能改進效能,常用的timeit和memory_profiler,此外還有profile、cProfile、hotshot等,memory_profiler用了psutil,所以不能跟蹤cpython的擴充;
2.用C來解決費時的處理,c是效率的代名詞,也是python用來解決效率問題的主要途徑,甚至有時候我都覺得python是c的完美搭檔。常用的是Cython,直接把py代碼c化然後又能像使用py包一樣使用,其次是ctypes,效率最最高的存在,最後還有CPython和cffi都是屌屌的存在;
3.最佳化演算法,所有語言通病,演算法的提升我覺得是在所有提升之上的,但也是最難的,好在現在大部分常用的演算法都已經封包,除非自己給自己挖坑,所以弄懂標準庫裡的資料結構和常用api是如何?的很重要;
4.2裡的實現有人做了更高效的包用以替換python中常見的一些實現,如果瓶頸在stringio、pickle、profile這類上的可以考慮替換為c的版本;
5.資料結構盡量使用元組tuple,特別是資料量大的時候,實在不行list也可以,盡量不要用class,如果一定要用可以加slot,效率再不夠就只能結合2來加速了;
6.消極式載入,import不是一定要寫在一頁的開始,哪裡都可以,越片段越能把包的載入延遲甚至不被載入;
7.用multiprocessing來實現多線程,可以跳出GIL的限制;
8.python處理迴圈很爛,解釋性語言就這樣,跟其它編譯型語言比就是蝸牛,所以減少迴圈次數和嵌套次數能顯著提升效能,當然了使用pypy就沒有這個問題了;
9.使用加速器,很喜歡psyco的使用方式,如果用2.7-的版本那麼不失為一個懶人的選擇,現在已經不再維護,創始人去了pypy,pypy是用Python實現的python,底層轉為平台依賴的c、.net、java的中繼語言,方式非常聰明,大愛,但是缺點是庫的支援還不完善,我的項目基本都能支援,解決幾個小問題即可,如果效能瓶頸在迴圈和記憶體上可以試試,最大的好處是不需要更改一句代碼和做另外的設定,沒有任何侵入。
參考資料:
Python 代碼效能最佳化技巧: https://www.ibm.com/developerworks/cn/linux/l-cn-python-optim/
Python效能最佳化技巧: http://kuanghy.github.io/2016/09/26/python-optimize