python super
一、問題的發現與提出
在Python類的方法(method)中,要調用父類的某個方法,在Python 2.2以前,通常的寫法如程式碼片段1:
程式碼片段1:
class A:
def __init__(self):
print "enter A"
print "leave A"
class B(A):
def __init__(self):
print "enter B"
A.__init__(self)
print "leave B"
>>> b = B()
enter B
enter A
leave A
leave B
即,使用非綁定的類方法(用類名來引用的方法),並在參數列表中,引入待綁定的對象(self),從而達到調用父類的目的。
這樣做的缺點是,當一個子類的父類發生變化時(如類B的父類由A變為C時),必須遍曆整個類定義,把所有的通過非綁定的方法的類名全部替換過來,例如程式碼片段2,
程式碼片段2:
class B(C): # A --> C
def __init__(self):
print "enter B"
C.__init__(self) # A --> C
print "leave B"
如果代碼簡單,這樣的改動或許還可以接受。但如果代碼量龐大,這樣的修改可能是災難性的。
因此,自Python 2.2開始,Python添加了一個關鍵字super,來解決這個問題。下面是Python 2.3的官方文檔說明:
super(type[, object-or-type])
Return the superclass of type. If the second argument is omitted the super object
returned is unbound. If the second argument is an object, isinstance(obj, type)
must be true. If the second argument is a type, issubclass(type2, type) must be
true. super() only works for new-style classes.
A typical use for calling a cooperative superclass method is:
class C(B):
def meth(self, arg):
super(C, self).meth(arg)
New in version 2.2.
從說明來看,可以把類B改寫如程式碼片段3:
程式碼片段3:
class A(object): # A must be new-style class
def __init__(self):
print "enter A"
print "leave A"
class B(C): # A --> C
def __init__(self):
print "enter B"
super(B, self).__init__()
print "leave B"
嘗試執行上面同樣的代碼,結果一致,但修改的代碼只有一處,把代碼的維護量降到最低,是一個不錯的用法。因此在我們的開發過程中,super關鍵字被大量使用,而且一直表現良好。
在我們的印象中,對於super(B, self).__init__()是這樣理解的:super(B, self)首先找到B的父類(就是類A),然後把類B的對象self轉換為類A的對象(通過某種方式,一直沒有考究是什麼方式,慚愧),然後“被轉換”的類A對象調用自己的__init__函數。考慮到super中只有指明子類的機制,因此,在多繼承的類定義中,通常我們保留使用類似程式碼片段1的方法。
有一天某同事設計了一個相對複雜的類體繫結構(我們先不要管這個類體系設計得是否合理,僅把這個例子作為一個題目來研究就好),代碼如程式碼片段4:
程式碼片段4:
class A(object):
def __init__(self):
print "enter A"
print "leave A"
class B(object):
def __init__(self):
print "enter B"
print "leave B"
class C(A):
def __init__(self):
print "enter C"
super(C, self).__init__()
print "leave C"
class D(A):
def __init__(self):
print "enter D"
super(D, self).__init__()
print "leave D"
class E(B, C):
def __init__(self):
print "enter E"
B.__init__(self)
C.__init__(self)
print "leave E"
class F(E, D):
def __init__(self):
print "enter F"
E.__init__(self)
D.__init__(self)
print "leave F"
>>> f = F()
enter F
enter E
enter B
leave B
enter C
enter D
enter A
leave A
leave D
leave C
leave E
enter D
enter A
leave A
leave D
leave F
明顯地,類A和類D的初始化函數被重複調用了2次,這並不是我們所期望的結果!我們所期望的結果是最多隻有類A的初始化函數被調用2次——其實這是多繼承的類體系必須面對的問題。我們把程式碼片段4的類體系畫出來,如:
object
| \
| A
| / |
B C D
\ / |
E |
\ |
F
按我們對super的理解,可以看出,在調用類C的初始化函數時,應該是調用類A的初始化函數,但事實上卻調用了類D的初始化函數。好一個詭異的問題!
也就是說,mro中記錄了一個類的所有基類的類類型序列。查看mro的記錄,發覺包含7個元素,7個類名分別為:
F E B C D A object
從而說明了為什麼在C.__init__中使用super(C, self).__init__()會調用類D的初始化函數了。 ???
我們把程式碼片段4改寫為:
程式碼片段9:
class A(object):
def __init__(self):
print "enter A"
super(A, self).__init__() # new
print "leave A"
class B(object):
def __init__(self):
print "enter B"
super(B, self).__init__() # new
print "leave B"
class C(A):
def __init__(self):
print "enter C"
super(C, self).__init__()
print "leave C"
class D(A):
def __init__(self):
print "enter D"
super(D, self).__init__()
print "leave D"
class E(B, C):
def __init__(self):
print "enter E"
super(E, self).__init__() # change
print "leave E"
class F(E, D):
def __init__(self):
print "enter F"
super(F, self).__init__() # change
print "leave F"
>>> f = F()
enter F
enter E
enter B
enter C
enter D
enter A
leave A
leave D
leave C
leave B
leave E
leave F
明顯地,F的初始化不僅完成了所有的父類的調用,而且保證了每一個父類的初始化函數只調用一次。
三、延續的討論
我們再重新看上面的類體系圖,如果把每一個類看作圖的一個節點,每一個從子類到父類的直接繼承關係看作一條有向邊,那麼該體系圖將變為一個有向圖。不能發現mro的順序正好是該有向圖的一個拓撲排序序列。
從而,我們得到了另一個結果——Python是如何去處理多繼承。支援多繼承的傳統的物件導向程式語言(如C++)是通過虛擬繼承的方式去實現多繼承中父類的建構函式被多次調用的問題,而Python則通過mro的方式去處理。
但這給我們一個難題:對於提供類體系的編寫者來說,他不知道使用者會怎麼使用他的類體系,也就是說,不正確的後續類,可能會導致原有類體系的錯誤,而且這樣的錯誤非常隱形,也難於發現。
四、小結
1. super並不是一個函數,是一個類名,形如super(B, self)事實上調用了super類的初始化函數,
產生了一個super對象;
2. super類的初始化函數並沒有做什麼特殊的操作,只是簡單記錄了類類型和具體執行個體;
3. super(B, self).func的調用並不是用於調用當前類的父類的func函數;
4. Python的多繼承類是通過mro的方式來保證各個父類的函數被逐一調用,而且保證每個父類函數
只調用一次(如果每個類都使用super);
5. 混用super類和非綁定的函數是一個危險行為,這可能導致應該調用的父類函數沒有調用或者一
個父類函數被調用多次。
======================================================================================================
【python mro & Python class 的類型】
Python中的class分為classical和new-style兩大類。
classical是Python一直沿用的,new-style是Python 2.2引入的。
一個class繼承於object,或其bases class裡面任意一個繼承於object,這個class都是new-style class。
【MRO - Method Resolution Order】
對於classical和new-style class,在複雜的繼承結構中,class中method的調用順序(MRO)也是不同的。
classical是深度優先,new-style是廣度優先。如:
【範例程式碼】
class D:
def foo(self):
print "class D"
class B(D):
pass
class C(D):
def foo(self):
print "class C"
class A(B, C):
pass
f = A()
f.foo()
對於上面 classical 的情況,結果是“class D”。而如果將代碼改為 class D(object): 的話,結果就是“class C”。
============================================================================================
The Python 2.3 Method Resolution Order-the C3 Method Resolution Order
C3 linearization
From Wikipedia, the free encyclopedia
In computing, the C3 superclass linearization is an algorithm used
primarily to obtain the order in which methods should be inherited (the "linearization"), and is
often termed "MRO" for Method Resolution Order. The name C3 refers to the three important properties of the resulting linearization: a consistent extended precedence
graph, preservation of local precedence order, and monotonicity.
It was first published at the 1996 OOPSLA conference, in a paper entitled "A Monotonic Superclass Linearization for Dylan".[1] Subsequently,
it has been chosen as the default algorithm for method resolution in Python 2.3 (and newer),[2][3] Perl
6,[4] and Parrot.[5] It
is also available as an alternative, non-default MRO in the core of Perl 5 starting with version 5.10.0.[6] An
extension implementation for earlier versions of Perl 5 named Class::C3
exists on CPAN.[7]
The Python 2.3 Method Resolution Order-C3