淺談Python中的範圍規則和閉包,淺談python
在對Python中的閉包進行簡單分析之前,我們先瞭解一下Python中的範圍規則。關於Python中範圍的詳細知識,有很多的博文都進行了介紹。這裡我們先從一個簡單的例子入手。
Python中的範圍
假設在互動式命令列中定義如下的函數:
>>> a = 1>>> def foo(): b = 2 c = 3 print "locals: %s" % locals() return "result: %d" % (a + b +c)>>> a = 1>>> def foo(): b = 2 c = 3 print "locals: %s" % locals() return "result: %d" % (a + b +c)
上述代碼先給a賦值1,緊接著定義了一個函數:foo()。在函數foo()中我們定義了兩個整數b和c,函數的傳回值為a、b、c三個數的和。
對上述函數進行驗證:
# result>>> foo()locals: {'c': 3, 'b': 2}result: 6# result>>> foo()locals: {'c': 3, 'b': 2}result: 6
根據驗證的結果,foo()函數的傳回值為6。上述的函數定義中只有b和c兩個變數的賦值,那調用函數是如何判斷a的值呢?這涉及到函數的範圍規則。本文摘錄《Python參考手冊(第4版)》中的相關論述:
每次執行一個函數時, 就會建立心得局部命名空間。該命名空間代表一個局部環境,其中包含函數參數的名稱和在函數體內賦值的變數名稱。解析這些名稱時:
解譯器將首先搜尋局部命名空間;
如果沒有找到匹配的名稱,它就會搜尋全域命名空間(函數的全域命名空間始終是定義該函數的模組);
如果解譯器在全域命名空間中也找不到匹配值,最終會檢查內建命名空間;
如果在內建命名空間中也找不到匹配值,就會引發NameError異常。
對應於上面的例子,foo函數首先會在局部命名空間中找三個變數的匹配值。上述代碼中的locals()方法給出了foo函數局部命名空間的內容。可以看出,局部命名空間是一個字典,包含b和c的值,這是因為我們在foo函數中定義了這兩個變數。然而,局部命名空間中不包含a的值,所以就需要在全域命名空間中尋找。可以使用__globals__擷取一個函數的局部命名空間。
# foo函數的全域命名空間>>> foo.__globals__{'a': 1, '__builtins__': <module '__builtin__' (built-in)>, '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x0000000004613518>, '__doc__': None}# foo函數的全域命名空間>>> foo.__globals__{'a': 1, '__builtins__': <module '__builtin__' (built-in)>, '__package__': None, '__name__': '__main__', 'foo': <function foo at 0x0000000004613518>, '__doc__': None}
foo函數的全域命名空間中包含了內建函數模組、foo函數、變數a以及其他的一些參數。由於在foo函數的全域命名空間中找到了變數a,foo函數便返回三個變數的和。
Python閉包
上述的Python範圍規則具有普遍性。然而,在Python中“一切皆對象”,函數也不例外。這也就是說可以把函數當作參數傳遞給其他的函數,也可以放在資料結構中,還可以作為函數的返回結果。在這種情況下,Python的範圍規則會發生什麼變化呢?我們還是舉一個例子:
>>> def foo(): a = 1 def bar(): b = 2 c = 3 return a + b + c return bar>>> def foo(): a = 1 def bar(): b = 2 c = 3 return a + b + c return bar
在這個例子中,我們定義了一個函數foo,並對變數a賦值。不過與之前的例子不同的是,在函數foo中我們還嵌套了一個函數bar,並且還定義了兩個變數,這個函數是作為函數foo的傳回值。根據上面的範圍規則,函數foo的局部範圍既不是函數bar的局部範圍,也不是它的全域範圍,那函數bar能否正確匹配變數a的值呢?我們我們來驗證一下這個函數是否能夠正常運行。
# 調用函數foo()>>> bar = foo()# 傳回值bar是一個函數>>> bar<function bar at 0x00000000045F3588># 調用bar()>>> bar()# 結果顯示為三個變數之和6
以上的驗證結果說明,在上述嵌套的函數中,內建函式可以正確地引用外部函數的變數,即使外部的函數已經返回。
這種內建函式的局部範圍中可以訪問外部函數局部範圍中變數的行為,我們稱為: 閉包。內建函式可以訪問外部函數變數的特點很像將外部函數的變數直接“打包”到內建函式中一樣,我們也可以這樣理解閉包:將組成函數的語句以及執行這些語句的環境“打包”在一起時得到的對象稱為閉包。
和閉包相關的幾個對象
為了瞭解閉包是怎麼實現內建函式對外部函數變數的引用,還需要對閉包相關的幾個對象進行介紹。關於這幾個對象會涉及到Python的底層實現,本文中對此不加以詳述,可以參考以下文章:
不過,為了直觀地說明閉包的實現過程(不分析底層實現),這裡先簡單介紹以下code對象。code對象是指代碼對象,表示編譯成位元組的的可執行Python代碼,或者位元組碼。它有幾個比較重要的屬性:
co_name:函數的名稱
co_nlocals: 函數使用的局部變數的個數
co_varnames: 一個包含局部變數名字的元組
co_cellvars: 是一個元組,包含嵌套的函數所引用的局部變數的名字
co_freevars: 是一個元組,儲存使用了的外層範圍中的變數名
co_consts: 是一個包含位元組碼使用的字面量的元組
其中比較關鍵的是co_varnames和co_freevars兩個屬性。我們對上面的例子稍加修改:
Python
>>> def foo(): a = 1 b = 2 def bar(): return a + 1 def bar2(): return b + 2 return bar>>> bar = foo()# 外層函數>>> foo.func_code.co_cellvars('a', 'b')>>> foo.func_code.co_freevars()# 內層嵌套函數>>> bar.func_code.co_cellvars()>>> bar.func_code.co_freevars('a',)>>> def foo(): a = 1 b = 2 def bar(): return a + 1 def bar2(): return b + 2 return bar>>> bar = foo()# 外層函數>>> foo.func_code.co_cellvars('a', 'b')>>> foo.func_code.co_freevars()# 內層嵌套函數>>> bar.func_code.co_cellvars()>>> bar.func_code.co_freevars('a',)
以上說明外層函數的code對象的co_cellvars儲存了內部嵌套函數需要引用的變數的名字,而內層嵌套函數的code對象的co_freevars儲存了需要引用外部函數範圍中的變數名字。具體來說,就是foo函數中嵌套了兩個函數,它們都需要引用foo函數局部範圍中的變數,所以foo.func_code.co_cellvars便包含變數a和變數b的名稱。而函數bar是foo的傳回值,只引用了變數a,因此bar.func_code.co_freevars中便只包含變數a。
內建函式和外部函數的co_freevars、co_cellvars的對應關係,使得在函數編譯過程中內建函式具有了一個閉包的特殊屬性__closure__(底層中對此有相關實現)。__closure__屬性是一個由cell對象組成的元組,包含了由多個範圍引用的變數。可以做以下驗證:
>>> foo.__closure__ #None# 內建函式bar對變數a的引用>>> bar.__closure__(<cell at 0x00000000044F6798: int object at 0x0000000003FA4B38>,)# 內建函式bar引用的變數a的值>>> bar.__closure__[0].cell_contents1
本文簡單講解了PYTHON的閉包,範圍的基本知識,如果想詳細瞭解,請在本站中查詢Python中的範圍規則和閉包詳解