用Python中的__slots__緩衝資源以節省記憶體開銷的方法

來源:互聯網
上載者:User
我們曾經提到,Oyster.com的Python web伺服器怎樣利用一個巨大的Python dicts(hash table),緩衝大量的靜態資源。我們最近在Image類中,用僅僅一行__slots__代碼,讓每個6G記憶體佔用的服務進程(共4個),省出超過2G來。

這是其中一個伺服器在部署代碼前後的:

我們alloc了大約一百萬個類似如下class的執行個體:

class Image(object):
def __init__(self, id, caption, url):
self.id = id
self.caption = caption
self.url = url
self._setup()

# ... other methods ...

預設情況下,Python用一個dict來儲存物件執行個體的屬性。這在一般情況下還不錯,而且非常靈活,乃至你在運行時可以隨意設定新的屬性。

但是,對一些在”編譯”前就知道該有幾個固定屬性的小class來說,這個dict就有點浪費記憶體了。而當你把這個小浪費乘上一百萬,那可就大不同了。在Python中,你可以在class中設定__slots__,它是一個包含這些固定的屬性名稱的list。這樣Python就不會再使用dict,而且只分配這些屬性的空間。

class Image(object):
__slots__ = ['id', 'caption', 'url']

def __init__(self, id, caption, url):
self.id = id
self.caption = caption
self.url = url
self._setup()

# ... other methods ...

你還可以用collections.namedtuple,它允許訪問參數,但只佔用一個tuple的空間。這跟__slots__類似。不過我總覺得繼承一個namedtuple類很奇怪。另外,如果你需要自訂初始化,你應該重載__new__而不是__init__。

警告:不要貿然進行這個最佳化,把它用在所有地方。這種做法不利於代碼維護,而且只有當你有數以千計的執行個體的時候才會有明顯效果。

譯註:作者在評論中關於”不利於代碼維護“的說法:

webreac:我覺得__slots__關鍵字不只是速度最佳化(註:這裡應該是記憶體最佳化),也是類欄位名的一個可靠”文檔“。這有利於代碼維護。為什麼你覺得它不好?

Ben Hoyt(作者):有趣的說法——我不確定應不應該把__slots__作為文檔。不過的確是不錯的注意。我之前這麼說的原因是,你需要對欄位名”定義“兩次(不夠DRY)。namedtuple也類似。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.