Python序列化的概念很簡單。記憶體裡面有一個資料結構,你希望將它儲存下來,重用,或者發送給其他人。你會怎麼做?這取決於你想要怎麼儲存,怎麼重用,發送給誰。很多遊戲允許你在退出的時候儲存進度,然後你再次啟動的時候回到上次退出的地方。(實際上,很多非遊戲程式也會這麼幹)在這種情況下,一個捕獲了當前進度的資料結構需要在你退出的時候儲存到硬碟上,接著在你重新啟動的時候從硬碟上載入進來。
Python標準庫提供pickle和cPickle模組。cPickle是用C編碼的,在運行效率上比pickle要高,但是cPickle模組中定義的類型不能被繼承(其實大多數時候,我們不需要從這些類型中繼承,推薦使用cPickle)。cPickle和pickle的序列化/還原序列化規則是一樣的,使用pickle序列化一個對象,可以使用cPickle來還原序列化。同時,這兩個模組在處理自參考型別時會變得更加“聰明”,它不會無限制的遞迴序列化自引用對象,對於同一對象的多次引用,它只會序列化一次。
pickle模組中的兩個主要函數是dump()和load()。dump()函數接受一個資料對象和一個檔案控制代碼作為參數,把資料對象以特定的格式儲存到給定的檔案中。當我們使用load()函數從檔案中取出已儲存的對象時,pickle知道如何恢複這些對象到它們本來的格式。
dumps()函數執行和dump()函數相同的序列化。取代接受流對象並將序列化後的資料儲存到磁碟檔案,這個函數簡單的返回序列化的資料。
loads()函數執行和load()函數一樣的還原序列化。取代接受一個流對象並去檔案讀取序列化後的資料,它接受包含序列化後的資料的str對象, 直接返回的對象。
cPickle.dump(obj, file, protocol=0)
序列化對象,並將結果資料流寫入到檔案對象中。參數protocol是序列化模式,預設值為0,表示以文本的形式序列化。protocol的值還可以是1或2,表示以二進位的形式序列化。
cPickle.load(file)
還原序列化對象。將檔案中的資料解析為一個Python對象。
下面通過一個簡單的例子來示範上面兩個方法的使用:
>>> import pickle,cPickle>>> info_dict = {'name':'yeho','age':100,'Lang':'Python'}>>> f = open('info.pkl','wb')>>> pickle.dump(info_dict,f)>>> f.close()>>> exit()
# cat info.pkl(dp0S'Lang'p1S'Python'p2sS'age'p3I100sS'name'p4S'yeho'p5s.
>>> import cPickle>>> info_dictTraceback (most recent call last): File "", line 1, in NameError: name 'info_dict' is not defined>>> f = open('info.pkl','r+')>>> info2_dict = cPickle.load(f)>>> info2_dict{'Lang': 'Python', 'age': 100, 'name': 'yeho'}>>> info2_dict['age'] = 110>>> cPickle.dump(info2_dict,f)>>> f.close()>>> exit()
>>> import pickle>>> f = open('info.pkl','r+')>>> info_dict = pickle.load(f)>>> info_dict{'Lang': 'Python', 'age': 100, 'name': 'yeho'}>>> info2_dict = pickle.load(f)>>> info2_dict{'Lang': 'Python', 'age': 110, 'name': 'yeho'}>>> info3_dict = pickle.load(f)Traceback (most recent call last): File "", line 1, in File "/usr/lib64/python2.6/pickle.py", line 1370, in load return Unpickler(file).load() File "/usr/lib64/python2.6/pickle.py", line 858, in load dispatch[key](self) File "/usr/lib64/python2.6/pickle.py", line 880, in load_eof raise EOFErrorEOFError