Python記憶體回收機制:gc模組

來源:互聯網
上載者:User

標籤:

    在Python中,為瞭解決記憶體泄露問題,採用了對象引用計數,並基於引用計數實現自動垃圾回

    由於Python 有了自動記憶體回收功能,就造成了不少初學者誤認為不必再受記憶體流失的騷擾了。但如果仔細查看一下Python文檔對 __del__() 函數的描述,就知道這種好日子裡也是有陰雲的。下面摘抄一點文檔內容如下:

Some common situations that may prevent the reference count of an object from going to zero include: circular references between objects (e.g., a doubly-linked list or a tree data structure with parent and child pointers); a reference to the object on the stack frame of a function that caught an exception (the traceback stored in sys.exc_traceback keeps the stack frame alive); or a reference to the object on the stack frame that raised an unhandled exception in interactive mode (the traceback stored in sys.last_traceback keeps the stack frame alive).

  可見, __del__() 函數的對象間的循環參考是導致記憶體流失的主凶。但沒有__del__()函數的對象間的循環參考是可以被記憶體回收行程回收掉的。

    如何知道一個對象是否記憶體泄露掉了呢?

    可以通過Python的擴充模組gc來查看不能回收掉的對象的詳細資料。

 

例1:沒有出現記憶體泄露的

import gcimport sysclass CGcLeak(object):    def __init__(self):        self._text = ‘#‘ * 10    def __del__(self):        passdef make_circle_ref():    _gcleak = CGcLeak()    print "_gcleak ref count0: %d" %(sys.getrefcount(_gcleak))    del _gcleak    try:        print "_gcleak ref count1 :%d" %(sys.getrefcount(_gcleak))    except UnboundLocalError:           # 本地變數xxx引用前沒定義        print "_gcleak is invalid!"def test_gcleak():    gc.enable()                         #設定記憶體回收行程調試標誌    gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS)    print "begin leak test..."    make_circle_ref()    print "\nbegin collect..."    _unreachable = gc.collect()    print "unreachable object num:%d" %(_unreachable)    print "garbage object num:%d" %(len(gc.garbage))   #gc.garbage是一個list對象,清單項目是垃圾收集器發現的不可達(即垃圾對象)、但又不能釋放(不可回收)的對象,通常gc.garbage中的對象是引用對象還中的對象。因Python不知用什麼順序來調用對象的__del__函數,導致對象始終存活在gc.garbage中,造成記憶體泄露 if __name__ == "__main__": test_gcleak()。如果知道一個安全次序,那麼就可以打破引用煥,再執行del gc.garbage[:]從而清空垃圾對象列表

結果

begin leak test..._gcleak ref count0: 2         #對象_gcleak的引用計數為2_gcleak is invalid!           #因為執行了del函數,_gcleak變為了不可達的對象begin collect...              #開始記憶體回收unreachable object num:0      #本次記憶體回收發現的不可達的對象個數為0garbage object num:0          #整個解譯器中垃圾對象的個數為0

    結論是對象_gcleak的引用計數是正確的,也沒發生記憶體流失。

 

例2:對自己的循環參考造成記憶體泄露

import gcimport sysclass CGcLeak(object):    def __init__(self):        self._text = ‘#‘ * 10    def __del__(self):        passdef make_circle_ref():    _gcleak = CGcLeak()    _gcleak._self = _gcleak     #自己循環參考自己    print "_gcleak ref count0: %d" %(sys.getrefcount(_gcleak))    del _gcleak    try:        print "_gcleak ref count1 :%d" %(sys.getrefcount(_gcleak))    except UnboundLocalError:        print "_gcleak is invalid!"def test_gcleak():    gc.enable()    gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS)    print "begin leak test..."    make_circle_ref()    print "\nbegin collect..."    _unreachable = gc.collect()    print "unreachable object num:%d" %(_unreachable)    print "garbage object num:%d" %(len(gc.garbage))if __name__ == "__main__":    test_gcleak()

結果

begin leak test...gc: uncollectable <CGcLeak 00000000026366A0>_gcleak ref count0: 3_gcleak is invalid!gc: uncollectable <dict 0000000002667BD8>begin collect...unreachable object num:2       #本次回收不可達的對象個數為2garbage object num:1           #整個解譯器中垃圾個數為1

 

例3:多個對象間的循環參考造成記憶體泄露 

import gcimport sysclass CGcLeakA(object):    def __init__(self):        self._text = ‘$‘ * 10    def __del__(self):        passclass CGcLeakB(object):    def __init__(self):        self._text = ‘$‘ * 10    def __del__(self):        passdef make_circle_ref():    _a = CGcLeakA()    _b = CGcLeakB()    _a.s = _b    _b.d = _a    print "ref count0:a=%d b=%d" %(sys.getrefcount(_a), sys.getrefcount(_b))    del _a    del _b    try:        print "ref count1:a%d" %(sys.getrefcount(_a))    except UnboundLocalError:        print "_a is invalid!"def test_gcleak():    gc.enable()    gc.set_debug(gc.DEBUG_COLLECTABLE | gc.DEBUG_UNCOLLECTABLE | gc.DEBUG_INSTANCES | gc.DEBUG_OBJECTS)    print "begin leak test..."    make_circle_ref()    print "\nbegin collect..."    _unreachable = gc.collect()    print "unreachable object num:%d" %(_unreachable)    print "garbage object num:%d" %(len(gc.garbage))if __name__ == "__main__":    test_gcleak()

結果

begin leak test...ref count0:a=3 b=3_a is invalid!begin collect...unreachable object num:4garbage object num:2gc: uncollectable <CGcLeakA 00000000022766D8>gc: uncollectable <CGcLeakB 0000000002276710>gc: uncollectable <dict 00000000022A7E18>gc: uncollectable <dict 00000000022DF3C8>

 

結論

    Python 的 gc 有比較強的功能,比如設定 gc.set_debug(gc.DEBUG_LEAK) 就可以進行循環參考導致的記憶體泄露的檢查。如果在開發時進行記憶體泄露檢查;在發布時能夠確保不會記憶體泄露,那麼就可以延長 Python 的記憶體回收時間間隔、甚至主動關閉記憶體回收機制,從而提高運行效率。

 

有待於深入研究的知識:監控Python中的引用計數

參考:Python的記憶體流失及gc模組的流量分析

 

Python記憶體回收機制:gc模組

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.