python對json的相關操作以及json模組的簡要分析

來源:互聯網
上載者:User

標籤:python   json   decode   encode   dump   

JSON(JavaScript Object Notation) 是一種輕量級的資料交換格式。易於人閱讀和編寫。同時也易於機器解析和產生。

JSON有兩種結構:

第一種就是“名稱/值”對的集合。在python中相當於字典類型,在其他語言中,它被理解為對象(object),紀錄(record),結構(struct),字典(dictionary),雜湊表(hash table),有鍵列表(keyed list),或者關聯陣列 (associative array)。

第二種就是值的有序列表。在大部分語言中,它被理解為數組(array)。

這兩種都是常見的資料結構。大部分語言都以某種形式支援它們。這使得一種資料格式在同樣基於這些結構的程式設計語言之間交換成為可能。


json官方說明參見:http://json.org/
Python操作json的標準api庫參考:http://docs.python.org/library/json.html


對單一資料型別的encoding 和 decoding:

使用簡單的json.dumps方法對單一資料型別進行編碼,例如:

import json obj = [[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]encodedjson = json.dumps(obj)print repr(obj)print encodedjson

輸出:[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}][[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]

通過輸出的結果可以看出,簡單類型通過encode之後跟其原始的repr()輸出結果非常相似,但是有些資料類型進行了改變,例如上例中的元組則轉換為了列表。在json的編碼過程中,會存在從python原始類型向json類型的轉化過程,具體的轉化對照如下:

json.dumps()方法返回了一個str對象encodedjson,我們接下來在對encodedjson進行decode,得到未經處理資料,需要使用的json.loads()函數:


decodejson = json.loads(encodedjson)print type(decodejson)print decodejson[4]['key1']print decodejson

輸出:<type 'list'>[1, 2, 3][[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]

loads方法返回了原始的對象,但是仍然發生了一些資料類型的轉化。比如,上例中‘abc’轉化為了unicode類型。從json到python的類型轉化對照如下:

json.dumps方法提供了很多好用的參數可供選擇,比較常用的有sort_keys(對dict對象進行排序,我們知道預設dict是無序存放的),separators,indent等參數。

排序功能使得儲存的資料更加有利於觀察,也使得對json輸出的對象進行比較,例如:

data1 = {'b':789,'c':456,'a':123}data2 = {'a':123,'b':789,'c':456}d1 = json.dumps(data1,sort_keys=True)d2 = json.dumps(data2)d3 = json.dumps(data2,sort_keys=True)print d1print d2print d3print d1==d2print d1==d3

輸出:{"a": 123, "b": 789, "c": 456}{"a": 123, "c": 456, "b": 789}{"a": 123, "b": 789, "c": 456}FalseTrue

上例中,本來data1和data2資料應該是一樣的,但是由於dict儲存的無序特性,造成兩者無法比較。因此兩者可以通過排序後的結果進行儲存就避免了資料比較不一致的情況發生,但是排序後再進行儲存,系統必定要多做一些事情,也一定會因此造成一定的效能消耗,所以適當排序是很重要的。

indent參數是縮排的意思,它可以使得資料存放區的格式變得更加優雅。


data1 = {'b':789,'c':456,'a':123}d1 = json.dumps(data1,sort_keys=True,indent=4)print d1

輸出:{    "a": 123,    "b": 789,    "c": 456}

輸出的資料被格式化之後,變得可讀性更強,但是卻是通過增加一些冗餘的空白格來進行填充的。json主要是作為一種資料通訊的格式存在的,而網路通訊是很在乎資料的大小的,無用的空格會佔據很多通訊頻寬,所以適當時候也要對資料進行壓縮。separator參數可以起到這樣的作用,該參數傳遞是一個元組,包含分割對象的字串。

print 'DATA:', repr(data)print 'repr(data)             :', len(repr(data))print 'dumps(data)            :', len(json.dumps(data))print 'dumps(data, indent=2)  :', len(json.dumps(data, indent=4))print 'dumps(data, separators):', len(json.dumps(data, separators=(',',':')))

輸出:DATA: {'a': 123, 'c': 456, 'b': 789}repr(data)             : 30dumps(data)            : 30dumps(data, indent=2)  : 46dumps(data, separators): 25

通過移除多餘的空白符,達到了壓縮資料的目的,而且效果還是比較明顯的。

另一個比較有用的dumps參數是skipkeys,預設為False。 dumps方法儲存dict對象時,key必須是str類型,如果出現了其他類型的話,那麼會產生TypeError異常,如果開啟該參數,設為True的話,則會比較優雅的過度。

data = {'b':789,'c':456,(1,2):123}print json.dumps(data,skipkeys=True)

輸出:{"c": 456, "b": 789}

 

處理自己的資料類型

json模組不僅可以處理普通的python內建類型,也可以處理我們自訂的資料類型,而往往處理自訂的對象是很常用的。

首先,我們定義一個類Person。

class Person(object):    def __init__(self,name,age):        self.name = name        self.age = age    def __repr__(self):        return 'Person Object name : %s , age : %d' % (self.name,self.age)if __name__  == '__main__':    p = Person('Peter',22)    print p

如果直接通過json.dumps方法對Person的執行個體進行處理的話,會報錯,因為json無法支援這樣的自動轉化。通過上面所提到的json和python的類型轉化對照表,可以發現,object類型是和dict相關聯的,所以我們需要把我們自訂的類型轉化為dict,然後再進行處理。這裡,有兩種方法可以使用。

方法一:自己寫轉化函數

'''Created on 2011-12-14@author: Peter'''import Personimport json p = Person.Person('Peter',22) def object2dict(obj):    #convert object to a dict    d = {}    d['__class__'] = obj.__class__.__name__    d['__module__'] = obj.__module__    d.update(obj.__dict__)    return d def dict2object(d):    #convert dict to object    if'__class__' in d:        class_name = d.pop('__class__')        module_name = d.pop('__module__')        module = __import__(module_name)        class_ = getattr(module,class_name)        args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args        inst = class_(**args) #create new instance    else:        inst = d    return inst d = object2dict(p)print d#{'age': 22, '__module__': 'Person', '__class__': 'Person', 'name': 'Peter'} o = dict2object(d)print type(o),o#<class 'Person.Person'> Person Object name : Peter , age : 22 dump = json.dumps(p,default=object2dict)print dump#{"age": 22, "__module__": "Person", "__class__": "Person", "name": "Peter"} load = json.loads(dump,object_hook = dict2object)print load#Person Object name : Peter , age : 22

上面代碼已經寫的很清楚了,實質就是自訂object類型和dict類型進行轉化。object2dict函數將對象模組名、類名以及__dict__儲存在dict對象裡,並返回。dict2object函數則是反解出模組名、類名、參數,建立新的對象並返回。在json.dumps 方法中增加default參數,該參數表示在轉化過程中調用指定的函數,同樣在decode過程中json.loads方法增加object_hook,指定轉化函數。

方法二:繼承JSONEncoder和JSONDecoder類,覆寫相關方法

JSONEncoder類負責編碼,主要是通過其default函數進行轉化,我們可以override該方法。同理對於JSONDecoder。

'''Created on 2011-12-14@author: Peter'''import Personimport json p = Person.Person('Peter',22) class MyEncoder(json.JSONEncoder):    def default(self,obj):        #convert object to a dict        d = {}        d['__class__'] = obj.__class__.__name__        d['__module__'] = obj.__module__        d.update(obj.__dict__)        return d class MyDecoder(json.JSONDecoder):    def __init__(self):        json.JSONDecoder.__init__(self,object_hook=self.dict2object)    def dict2object(self,d):        #convert dict to object        if'__class__' in d:            class_name = d.pop('__class__')            module_name = d.pop('__module__')            module = __import__(module_name)            class_ = getattr(module,class_name)            args = dict((key.encode('ascii'), value) for key, value in d.items()) #get args            inst = class_(**args) #create new instance        else:            inst = d        return inst  d = MyEncoder().encode(p)o =  MyDecoder().decode(d) print dprint type(o), o

來自糖拌鹹魚大大的部落格。。。。。


python對json的相關操作以及json模組的簡要分析

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.