Python 迭代對象、迭代器、產生器詳解

來源:互聯網
上載者:User

標籤:

在瞭解Python的資料結構時,容器(container)、可迭代對象(iterable)、迭代器(iterator)、產生器(generator)、列表/集合/字典推導式(list,set,dict comprehension)眾多概念參雜在一起,難免讓初學者一頭霧水,本文將一一為大家進行介紹,希望對大家學習python有所協助。

容器(container)

 

容器是一種把多個元素組織在一起的資料結構,容器中的元素可以逐個地迭代擷取,可以用 in ,  not in 關鍵字判斷元素是否包含在容器中。通常這類資料結構把所有的元素儲存在記憶體中(也有一些特列並不是所有的元素都放在記憶體)在Python中,常見的容器物件有:

 

list, deque, ....

 

set, frozensets, ....

 

dict, defaultdict, OrderedDict, Counter, ....

 

tuple, namedtuple, …

 

str

 

容器比較容易理解,因為你就可以把它看作是一個盒子、一棟房子、一個柜子,裡面可以塞任何東西。從技術角度來說,當它可以用來詢問某個元素是否包含在其中時,那麼這個對象就可以認為是一個容器,比如 list,set,tuples都是容器物件:

 

>>> assert 1 in [1, 2, 3]      # lists

>>> assert 4 not in [1, 2, 3]

>>> assert 1 in {1, 2, 3}      # sets

>>> assert 4 not in {1, 2, 3}

>>> assert 1 in (1, 2, 3)      # tuples

>>> assert 4 not in (1, 2, 3)

詢問某元素是否在dict中用dict的中key:

 

>>> d = {1: ’foo’, 2: ’bar’, 3: ’qux’}

>>> assert 1 in d

>>> assert ’foo’ not in d  # ’foo’ 不是dict中的元素

詢問某substring是否在string中:

 

>>> s = ’foobar’

>>> assert ’b’ in s

>>> assert ’x’ not in s

>>> assert ’foo’ in s

儘管絕大多數容器都提供了某種方式來擷取其中的每一個元素,但這並不是容器本身提供的能力,而是 可迭代對象 賦予了容器這種能力,當然並不是所有的容器都是可迭代的,比如: Bloom filter ,雖然Bloom filter可以用來檢測某個元素是否包含在容器中,但是並不能從容器中擷取其中的每一個值,因為Bloom filter壓根就沒把元素儲存在容器中,而是通過一個散列函數映射成一個值儲存在數組中。

 

可迭代對象(iterable)

 

剛才說過,很多容器都是可迭代對象,此外還有更多的對象同樣也是可迭代對象,比如處於開啟狀態的files,sockets等等。但凡是可以返回一個 迭代器 的對象都可稱之為可迭代對象,聽起來可能有點困惑,沒關係,先看一個例子:

 

>>> x = [1, 2, 3]

>>> y = iter(x)

>>> z = iter(x)

>>> next(y)

1

>>> next(y)

2

>>> next(z)

1

>>> type(x)

<class ’list’>

>>> type(y)

<class ’list_iterator’>

這裡 x 是一個可迭代對象,可迭代對象和容器一樣是一種通俗的叫法,並不是指某種具體的資料類型,list是可迭代對象,dict是可迭代對象,set也是可迭代對象。  y 和  z 是兩個獨立的迭代器,迭代器內部持有一個狀態,該狀態用於記錄當前迭代所在的位置,以方便下次迭代的時候擷取正確的元素。迭代器有一種具體的迭代器類型,比如  list_iterator ,  set_iterator 。可迭代對象實現了  __iter__ 和  __next__ 方法(python2中是  next 方法,python3是  __next__ 方法),這兩個方法對應內建函數  iter() 和  next() 。  __iter__ 方法返回可迭代對象本身,這使得他既是一個可迭代對象同時也是一個迭代器。

 

當運行代碼:

 

x = [1, 2, 3]

for elem in x:

   ...

實際執行情況是:


反編譯該段代碼,你可以看到解譯器顯示地調用 GET_ITER 指令,相當於調用  iter(x) ,  FOR_ITER 指令就是調用  next() 方法,不斷地擷取迭代器中的下一個元素,但是你沒法直接從指令中看出來,因為他被解譯器最佳化過了。

 

>>> import dis

>>> x = [1, 2, 3]

>>> dis.dis(’for _ in x: pass’)

 1           0 SETUP_LOOP              14 (to 17)

             3 LOAD_NAME                0 (x)

             6 GET_ITER

       >>    7 FOR_ITER                 6 (to 16)

            10 STORE_NAME               1 (_)

            13 JUMP_ABSOLUTE            7

       >>   16 POP_BLOCK

       >>   17 LOAD_CONST               0 (None)

            20 RETURN_VALUE

迭代器(iterator)

 

那麼什麼迭代器呢?它是一個帶狀態的對象,他能在你調用 next() 方法的時候返回容器中的下一個值,任何實現了  __next__() (python2中實現  next() )方法的對象都是迭代器,至於它是如何?的這並不重要。

 

所以,迭代器就是實現了原廠模式的對象,它在你每次你詢問要下一個值的時候給你返回。有很多關於迭代器的例子,比如 itertools 函數返回的都是迭代器對象。

 

產生無限序列:

 

>>> from itertools import count

>>> counter = count(start=13)

>>> next(counter)

13

>>> next(counter)

14

從一個有限序列中產生無限序列:

 

>>> from itertools import cycle

>>> colors = cycle([’red’, ’white’, ’blue’])

>>> next(colors)

’red’

>>> next(colors)

’white’

>>> next(colors)

’blue’

>>> next(colors)

’red’

從無限的序列中產生有限序列:

 

>>> from itertools import islice

>>> colors = cycle([’red’, ’white’, ’blue’])  # infinite

>>> limited = islice(colors, 0, 4)            # finite

>>> for x in limited:                        

...     print(x)

red

white

blue

red

為了更直觀地感受迭代器內部的執行過程,我們自訂一個迭代器,以斐波那契數列為例:

 

class Fib:

   def __init__(self):

       self.prev = 0

       self.curr = 1

   def __iter__(self):

       return self

   def __next__(self):

       value = self.curr

       self.curr += self.prev

       self.prev = value

       return value

>>> f = Fib()

>>> list(islice(f, 0, 10))

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

Fib既是一個可迭代對象(因為它實現了 __iter__ 方法),又是一個迭代器(因為實現了  __next__ 方法)。執行個體變數  prev 和  curr 使用者維護迭代器內部的狀態。每次調用  next() 方法的時候做兩件事:

 

為下一次調用 next() 方法修改狀態

 

為當前這次調用產生返回結果

 

迭代器就像一個懶載入的工廠,等到有人需要的時候才給它產生值返回,沒調用的時候就處於休眠狀態等待下一次調用。

 

產生器(generator)

 

產生器算得上是Python語言中最迷人的特性之一,產生器其實是一種特殊的迭代器,不過這種迭代器更加優雅。它不需要再像上面的類一樣寫 __iter__() 和  __next__() 方法了,只需要一個  yiled 關鍵字。 產生器一定是迭代器(反之不成立),因此任何產生器也是以一種懶載入的模式產生值。用產生器來實現斐波那契數列的例子是:

 

def fib():

   prev, curr = 0, 1

   while True:

       yield curr

       prev, curr = curr, curr + prev

>>> f = fib()

>>> list(islice(f, 0, 10))

[1, 1, 2, 3, 5, 8, 13, 21, 34, 55]

fib 就是一個普通的python函數,它特需的地方在於函數體中沒有  return 關鍵字,函數的傳回值是一個產生器對象。當執行  f=fib() 返回的是一個產生器對象,此時函數體中的代碼並不會執行,只有顯示或隱示地調用next的時候才會真正執行裡面的代碼。

 

產生器在Python中是一個非常強大的編程結構,可以用更少地中間變數寫流式代碼,此外,相比其它容器物件它更能節省記憶體和CPU,當然它可以用更少的代碼來實現相似的功能。現在就可以動手重構你的代碼了,但凡看到類似:

 

def something():

   result = []

   for ... in ...:

       result.append(x)

   return result

都可以用產生器函數來替換:

 

def iter_something():

   for ... in ...:

       yield x

產生器運算式(generator expression)

 

產生器運算式是列表推倒式的產生器版本,看起來像列表推導式,但是它返回的是一個產生器對象而不是列表對象。

 

>>> a = (x*x for x in range(10))

>>> a

<generator object <genexpr> at 0x401f08>

>>> sum(a)

285

 

來源:公眾帳號

 

Python 迭代對象、迭代器、產生器詳解

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.