python小專題——JSON

來源:互聯網
上載者:User

python對json的相關操作

  說實話,不做前端開發,對json真沒有太特殊的感情,最近遇到python操作json,束手無策,也準備簡單瞭解下相關知識。以前剛聽到json的時候,總把它誤以為一種語言,不料,它卻是一種資料結構。我按了tab鍵發現json的方法很少,只有6個,並且兩兩互逆。查看json的使用方法,除了官方的文檔(http://docs.python.org/2/library/json.html),還可以一個命令解決:>>> help(json),看了這個說明之後,然後下面所有的都是廢話了。不過介於這樣看不太方便,我還是準備"copy"一份到這裡,呵呵~~~

  首先JSON(JavaScript Object Notation)是一種輕量級的資料交換格式,或者可理解為一種通訊方式,能被WEB所識別和公認的資料類型,是“名稱/值”對的集合(A collection of name/value pairs。在不同的語言,它有不同的表現方式,如:對象(object),紀錄(record),結構(struct),字典(dictionary),雜湊表(hash table),有鍵列表(keyed list),或者關聯陣列 (associative array)。值的有序列表(An ordered list of values)。

  dumps方法和loads方法

簡單來理解就是:dumps方法——將python類型的資料編碼成json類型

        loads方法——將json類型的資料解碼成python類型

  首先學習一下對單一資料型別的encoding,使用json.dumps方法對單一資料型別進行編碼:

>>> import json>>> pyobj=[[1,2,3],123,123.123,'abc',{'key1':(1,2,3),'key2':(4,5,6)}]>>> encodedjson = json.dumps(pyobj)>>> print repr(pyobj)[[1, 2, 3], 123, 123.123, 'abc', {'key2': (4, 5, 6), 'key1': (1, 2, 3)}]>>> print encodedjson[[1, 2, 3], 123, 123.123, "abc", {"key2": [4, 5, 6], "key1": [1, 2, 3]}]

  仔細對比下兩個print的結果還是有區別的(有些資料類型發生了變化),在json的編碼過程中,會存在從python原始類型向json類型的轉化過程,具體的轉化對照如下:

      上述看出,json.dumps()方法返回了一個str對象encodedjson,接下來在對encodedjson進行decode,得到未經處理資料類型,需要使用的json.loads()函數:

>>> decodejson=json.loads(encodedjson)>>> print type(decodejson)  #查看解碼後的資料類型<type 'list'>>>> print decodejson[4]['key1'][1, 2, 3]>>> print decodejson[[1, 2, 3], 123, 123.123, u'abc', {u'key2': [4, 5, 6], u'key1': [1, 2, 3]}]

loads方法原始的對象,但發生了一些資料類型的轉化。比如,上例中‘abc’轉化為了unicode類型。從json到python的類型轉化對照如下:

  json.dumps方法提供了很多好用的參數可供選擇,比較常用的有sort_keys(對dict對象進行排序,我們知道預設dict是無序存放的),separators,indent等參數。

排序功能使得儲存的資料更加有利於觀察,也使得對json輸出的對象進行比較,例如:

  上例中,本來data1和data2資料應該是一樣的,但是由於dict儲存的無序特性,造成兩者無法比較。因此兩者可以通過排序後的結果進行儲存就避免了資料比較不一致的情況發生,但是排序後再進行儲存,系統必定要多做一些事情,也一定會因此造成一定的效能消耗,所以適當排序是很重要的。

indent參數是縮排的意思,它可以使得資料存放區的格式變得更加優雅。

 

  輸出的資料被格式化之後,變得可讀性更強,但是卻是通過增加一些冗餘的空白欄框來進行填充的。json主要是作為一種資料通訊的格式存在的,而網路通訊是很在乎資料的大小的,無用的空格會佔據很多通訊頻寬,所以適當時候也要對資料進行壓縮。separator參數可以起到這樣的作用,該參數傳遞是一個元組,包含分割對象的字串。

 

 

  通過移除多餘的空白符,達到了壓縮資料的目的,而且效果還是比較明顯的。

另一個比較有用的dumps參數是skipkeys,預設為False。 dumps方法儲存dict對象時,key必須是str類型,如果出現了其他類型的話,那麼會產生TypeError異常,如果開啟該參數,設為True的話,則會比較優雅的過度。

>>> data = {'b':789,'c':456,(1,2):123}>>> print json.dumps(data,skipkeys=True){"c": 456, "b": 789}

    當然還有一些其他參數,完整的參數是:

json.dumps(objskipkeys=Falseensure_ascii=Truecheck_circular=True,allow_nan=True

cls=Noneindent=Noneseparators=Noneencoding="utf-8",default=None

sort_keys=False**kw)

上述都是預設的值,當然可以對它進行改變,ensure_ascii預設是true,所有的非ASCII碼都會以\uXXXX的序列顯示出來。

  

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.