在介紹yield前有必要先說明下Python中的迭代器(iterator)和產生器(constructor)。
一、迭代器(iterator)
在Python中,for迴圈可以用於Python中的任何類型,包括列表、元祖等等,實際上,for迴圈可用於任何“可迭代對象”,這其實就是迭代器
迭代器是一個實現了迭代器協議的對象,Python中的迭代器協議就是有next方法的對象會前進到下一結果,而在一系列結果的末尾是,則會引發StopIteration。任何這類的對象在Python中都可以用for迴圈或其他遍曆工具迭代,迭代工具內部會在每次迭代時調用next方法,並且捕捉StopIteration異常來確定何時離開。
使用迭代器一個顯而易見的好處就是:每次只從對象中讀取一條資料,不會造成記憶體的過大開銷。
比如要逐行讀取一個檔案的內容,利用readlines()方法,我們可以這麼寫:
1 2
|
for line in open("test.txt").readlines(): print line |
這樣雖然可以工作,但不是最好的方法。因為他實際上是把檔案一次載入到記憶體中,然後逐行列印。當檔案很大時,這個方法的記憶體開銷就很大了。
利用file的迭代器,我們可以這樣寫:
1 2
|
for line in open("test.txt"): #use file iterators print line |
這是最簡單也是運行速度最快的寫法,他並沒顯式的讀取檔案,而是利用迭代器每次讀取下一行。
二、產生器(constructor)
產生器函數在Python中與迭代器協議的概念聯絡在一起。簡而言之,包含yield語句的函數會被特地編譯成產生器。當函數被調用時,他們返回一個產生器對象,這個對象支援迭代器介面。函數也許會有個return語句,但它的作用是用來yield產生值的。
不像一般的函數會產生值後退出,產生器函數在產生值後會自動掛起並暫停他們的執行和狀態,他的本地變數將儲存狀態資訊,這些資訊在函數恢複時將再度有效
1 2 3 4 5 6 7 8
|
>>> def g(n): ... for i in range(n): ... yield i **2 ... >>> for i in g(5): ... print i,":", ... 0 : 1 : 4 : 9 : 16 : |
要瞭解他的運行原理,我們來用next方法看看:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
|
>>> t = g(5) >>> t.next() 0 >>> t.next() 1 >>> t.next() 4 >>> t.next() 9 >>> t.next() 16 >>> t.next() Traceback (most recent call last): File "<stdin>", line 1, in <module> StopIteration |
在運行完5次next之後,產生器拋出了一個StopIteration異常,迭代終止。
再來看一個yield的例子,用產生器產生一個Fibonacci數列:
1 2 3 4 5 6 7 8 9 10
|
def fab(max): a,b = 0,1 while a < max: yield a a, b = b, a+b >>> for i in fab(20): ... print i,",", ... 0 , 1 , 1 , 2 , 3 , 5 , 8 , 13 , |
看到這裡應該就能理解產生器那個很抽象的概念了吧~~