賴勇浩(http://laiyonghao.com)
註:不是逐句翻譯,如有困惑,參詳原文(http://pushingtheweb.com/2011/03/ultra-fast-json-encoding-decoding-python/)。
在 ESN,我們大量使用 JSON,Python 2.6 內建的那個太慢,所以我們後來使用 simplejson。今時今日 JavaScript 和 JSON 更廣泛地使用了,所以我覺得可能這是一個值得我用 C 去最佳化的領域,而且也可以正明我寶刀未老。
UltraJSON
我花了一個周末來研究一下 JSON 編碼,並把我結果稱為 UltraJSON,從目前我做的初步的基準測試來看,他是我能找到的所有 JSON 轉碼器中最快的(如果不是,那我可以把它最佳化得更快!)。
Python 綁定
其實 UltraJSON 並非只能用於特定語言,只是為了方便我的同事使用,我就實現了它的 Python 綁定,稱為 ujson 模組。
更新:UltraJSON 現在可以在 PyPI 中找到了,包名叫 ujson,用 easy_install 或 pip 可以很方便地安裝它,你懂的。
當前基準測試
64位 Linux 基準測試
Python 2.6.6 (r266:84292, Sep 15 2010, 16:22:56)
OS Version: Ubuntu 10.10
System Type: x64-based PC
Processor: Intel(R) Core(TM) i5-2300 CPU @ 2.80GHz
Total Physical Memory: 4096 MB
Array with 256 utf-8 strings:
ujson encode : 2874.54652 calls/sec
simplejson encode : 1539.47999 calls/sec
cjson encode : 132.33571 calls/sec
ujson decode : 2072.09417 calls/sec
cjson decode : 991.20903 calls/sec
simplejson decode : 310.75309 calls/sec
Medium complex object:
ujson encode : 19001.01929 calls/sec
simplejson encode : 3512.29205 calls/sec
cjson encode : 3063.69959 calls/sec
ujson decode : 12791.80993 calls/sec
cjson decode : 8288.32916 calls/sec
simplejson decode : 6640.22169 calls/sec
Array with 256 strings:
ujson encode : 40161.78453 calls/sec
simplejson encode : 19301.40779 calls/sec
cjson encode : 12337.13166 calls/sec
ujson decode : 36944.81317 calls/sec
cjson decode : 30187.40167 calls/sec
simplejson decode : 25105.56562 calls/sec
Array with 256 doubles:
ujson encode : 6054.71950 calls/sec
simplejson encode : 2912.44353 calls/sec
cjson encode : 3539.51228 calls/sec
ujson decode : 27794.29735 calls/sec
cjson decode : 14892.38775 calls/sec
simplejson decode : 14879.00070 calls/sec
Array with 256 True values:
ujson encode : 168086.95325 calls/sec
simplejson encode : 49348.93309 calls/sec
cjson encode : 67392.90623 calls/sec
ujson decode : 139359.25968 calls/sec
cjson decode : 82552.26652 calls/sec
simplejson decode : 114998.51396 calls/sec
Array with 256 dict{string, int} pairs:
ujson encode : 24125.68837 calls/sec
simplejson encode : 5751.74871 calls/sec
cjson encode : 4735.65147 calls/sec
ujson decode : 17176.70493 calls/sec
cjson decode : 13420.93963 calls/sec
simplejson decode : 9854.27352 calls/sec
Dict with 256 arrays with 256 dict{string, int} pairs:
ujson encode : 86.52449 calls/sec
simplejson encode : 17.46117 calls/sec
cjson encode : 18.31323 calls/sec
ujson decode : 49.54660 calls/sec
cjson decode : 38.34094 calls/sec
simplejson decode : 28.18035 calls/sec
More on GitHub
很期待看到有人使用這個項目,更贊的是貢獻代碼,所以來我的 GitHub 倉庫(https://github.com/jskorpan/ultrajson)看看吧。
你要是把它綁定到更多語言就真的是酷斃了!