在編程過程中,多瞭解語言周邊的一些知識,以及一些技巧,可以讓你加速成為一個優秀的程式員。
對於Python程式員,你需要注意一下本文所提到的這些事情。你也可以看看Zen of Python(Python之禪),這裡面提到了一些注意事項,並配以樣本,可以協助你快速提高。
1. 漂亮勝於醜陋
實現一個功能:讀取一列資料,只返回偶數併除以2。下面的代碼,哪個更好一些呢?
複製代碼 代碼如下:#----------------------------------------
halve_evens_only = lambda nums: map(lambda i: i/2, filter(lambda i: not i%2, nums))
#----------------------------------------
def halve_evens_only(nums):
return [i/2 for i in nums if not i % 2]
2. 記住Python中非常簡單的事情
複製代碼 代碼如下:# 交換兩個變數
a, b = b, a
# 切片(slice)操作符中的step參數。(切片操作符在python中的原型是[start:stop:step],即:[開始索引:結束索引:步長值])
a = [1,2,3,4,5]
>>> a[::2] # 遍曆列表中增量為2的資料
[1,3,5]
# 特殊情況下,`x[::-1]`是實現x逆序的實用的方式
>>> a[::-1]
[5,4,3,2,1]
# 逆序並切片
>>> x[::-1]
[5, 4, 3, 2, 1]
>>> x[::-2]
[5, 3, 1]
3. 不要使用可變對象作為預設值
複製代碼 代碼如下:def function(x, l=[]): #不要這樣
def function(x, l=None): # 好的方式
if l is None:
l = []
這是因為當def聲明被執行時,預設參數總是被評估。
4. 使用iteritems而不是items
複製代碼 代碼如下:iteritems 使用generators ,因此當通過非常大的列表進行迭代時,iteritems 更好一些。
d = {1: "1", 2: "2", 3: "3"}
for key, val in d.items() # 當調用時構建完整的列表
for key, val in d.iteritems() # 當請求時只調用值
5. 使用isinstance ,而不是type
複製代碼 代碼如下:# 不要這樣做
if type(s) == type(""): ...
if type(seq) == list or \
type(seq) == tuple: ...
# 應該這樣
if isinstance(s, basestring): ...
if isinstance(seq, (list, tuple)): ...
原因可參閱:stackoverflow
注意我使用的是basestring 而不是str,因為如果一個unicode對象是字串的話,可能會試圖進行檢查。例如:
複製代碼 代碼如下:>>> a=u'aaaa'
>>> print isinstance(a, basestring)
True
>>> print isinstance(a, str)
False
這是因為在Python 3.0以下版本中,有兩個字串類型str 和unicode。
6. 瞭解各種容器
Python有各種容器資料類型,在特定的情況下,相比內建容器(如list 和dict ),這是更好的選擇。
我敢肯定,大部分人不使用它。我身邊一些粗心大意的人,一些可能會用下面的方式來寫代碼。
複製代碼 代碼如下:freqs = {}
for c in "abracadabra":
try:
freqs[c] += 1
except:
freqs[c] = 1
也有人會說下面是一個更好的解決方案:
複製代碼 代碼如下:freqs = {}
for c in "abracadabra":
freqs[c] = freqs.get(c, 0) + 1
更確切來說,應該使用collection 類型defaultdict。
複製代碼 代碼如下:from collections import defaultdict
freqs = defaultdict(int)
for c in "abracadabra":
freqs[c] += 1
其他容器:
namedtuple() # 工廠函數,用於建立帶命名欄位的元組子類
deque # 類似列表的容器,允許任意端快速附加和取出
Counter # dict子類,用於雜湊對象計數
OrderedDict # dict子類,用於儲存添加的命令記錄
defaultdict # dict子類,用於調用工廠函數,以補充缺失的值
7. Python中建立類的魔術方法(magic methods)
__eq__(self, other) # 定義 == 運算子的行為
__ne__(self, other) # 定義 != 運算子的行為
__lt__(self, other) # 定義 < 運算子的行為
__gt__(self, other) # 定義 > 運算子的行為
__le__(self, other) # 定義 <= 運算子的行為
__ge__(self, other) # 定義 >= 運算子的行為
8. 必要時使用Ellipsis(省略符號“...”)
Ellipsis 是用來對高維資料結構進行切片的。作為切片(:)插入,來擴充多維切片到所有的維度。例如:
複製代碼 代碼如下:>>> from numpy import arange
>>> a = arange(16).reshape(2,2,2,2)
# 現在,有了一個4維矩陣2x2x2x2,如果選擇4維矩陣中所有的首元素,你可以使用ellipsis符號。
>>> a[..., 0].flatten()
array([ 0, 2, 4, 6, 8, 10, 12, 14])
# 這相當於
>>> a[:,:,:,0].flatten()
array([ 0, 2, 4, 6, 8, 10, 12, 14])