絕大多數情況下,遍曆一個集合都是為了對元素應用某個動作或是進行篩選。如果看過本文的第二部分,你應該還記得有內建函數map和filter提供了這些功能,但Python仍然為這些操作提供了語言級的支援。
(x+1 for x in lst) #產生器運算式,返回迭代器。外部的括弧可在用於參數時省略。 [x+1 for x in lst] #列表解析,返回list
如你所見,產生器運算式和列表解析(註:這裡的翻譯有很多種,比如列表展開、列表推導等等,指的是同一個意思)的區別很小,所以人們提到這個特性時,簡單起見往往只描述成列表解析。然而由於返回迭代器時,並不是在一開始就計算所有的元素,這樣能得到更多的靈活性並且可以避開很多不必要的計算,所以除非你明確希望返回列表,否則應該始終使用產生器運算式。接下來的文字裡我就不區分這兩種形式了:)
你也可以為列表解析提供if子句進行篩選:
(x+1 for x in lst if x!=0)
或者提供多條for子句進行嵌套迴圈,嵌套次序就是for子句的順序:
((x, y) for x in range(3) for y in range(x))
列表解析就是鮮明的Pythonic。我常遇到兩個使用列表解析的問題,本應歸屬於最佳實務,但這兩個問題非常典型,所以不妨在這裡提一下:
第一個問題是,因為對元素應用的動作太複雜,不能用一個運算式寫出來,所以不使用列表解析。這是典型的思想沒有轉變的例子,如果我們將動作封裝成函數,那不就是一個運算式了嗎?
第二個問題是,因為if子句裡的條件需要計算,同時結果也需要進行同樣的計算,不希望計算兩遍,就像這樣:
(x.doSomething() for x in lst if x.doSomething()>0)
這樣寫確實很糟糕,但組合一下列表解析即可解決:
(x for x in (y.doSomething() for y in lst) if x>0)
內部的列表解析變數其實也可以用x,但為清晰起見我們改成了y。或者更清楚的,可以寫成兩個運算式:
tmp = (x.doSomething() for x in lst)(x for x in tmp if x > 0)
列表解析可以替代絕大多數需要用到map和filter的場合,可能正因為此,著名的靜態檢查工具pylint將map和filter的使用列為了警告。