利用python將json資料轉換為csv格式,jsoncsv
假設.json檔案中儲存的資料為:
{"type": "Point", "link": "http://www.dianping.com/newhotel/22416995", "coordinates": [116.37256372996957, 40.39798447055443], "category": "經濟型", "name": "北京荷塘山莊", "count": "278", "address": "北京市懷柔區黃花城村安四路", "price": "380"},{"type": "Point", "link": "http://www.dianping.com/newhotel/19717653", "coordinates": [116.56881588256466, 40.43310967948417], "category": "經濟型", "name": "慕田峪長城魚師傅鄉村酒店", "count": "89", "address": "北京市懷柔區渤海鎮葦店村(慕田峪長城下3公裡處,近懷黃路)", "price": "258"},{"type": "Point", "link": "http://www.dianping.com/newhotel/58365289", "coordinates": [116.62874974822378, 40.45610264855833], "category": "經濟型", "name": "北京蜜桃兒親子客棧", "count": "119", "address": "北京市懷柔區神堂峪風景區下官地11號", "price": "549"},
現在需要將上面的這些資料存為csv格式,其中字典的keys為csv中的屬性名稱,字典的values為csv中屬性對應的值。
如果只需要按照json的keys來產生csv,那麼操作比較簡單,直接按照下面的方法即可:
import csvimport jsonimport sysdef trans(path): jsonData=open(path+'.json') #csvfile = open(path+'.csv', 'w')#此處這樣寫會導致寫出來的檔案會有空行 #csvfile = open(path+'.csv', 'wb')#python2下 csvfile = open(path+'.csv', 'w',newline='')#python3下 for line in jsonData:#擷取屬性列表 dic=json.loads(line[0:-2]) keys=dic.keys() break writer = csv.writer(csvfile) writer.writerow(keys)#將屬性列表寫入csv中 for dic in jsonData:#讀取json資料的每一行,將values資料一次一行的寫入csv中 dic=json.loads(dic[0:-2]) writer.writerow(dic.values()) jsonData.close() csvfile.close()if __name__ == '__main__': path=str(sys.argv[1])#擷取path參數 print (path) trans(path)
在python3下運行,命令列輸入
python C:\Users\MaMQ\Documents\jsonToCsv.py C:\Users\MaMQ\Documents\data\geoFood
其中第三個參數為需要轉換的檔案的路徑和其名稱,將其尾碼刪除。運行檔案後即可得到轉換後的csv檔案。
如果需要對json檔案中每個字典的key欄位進行修改,比如需要將上面dict中的coordinate中的經緯度資料取出來存為x、y資料,則可以按照下面的方法(此方法還可以調整每個屬性顯示的順序,效果更好一點):
import csvimport jsonimport sysdef trans(path): jsonData=open(path+'.json') #csvfile = open(path+'.csv', 'w')#此處這樣寫會導致寫出來的檔案會有空行 #csvfile = open(path+'.csv', 'wb')#python2下 csvfile = open(path+'.csv', 'w',newline='')#python3下 keys=['id','name','category','price','count','type','address','link','x','y'] writer = csv.writer(csvfile) writer.writerow(keys) i=1 for dic in jsonData: dic=json.loads(dic[0:-2]) x=dic['coordinates'][0] y=dic['coordinates'][1] writer.writerow([str(i),dic['name'],dic['category'],dic['price'],dic['count'],dic['type'],dic['address'],dic['link'],x,y]) i+=1 jsonData.close() csvfile.close()if __name__ == '__main__': path=str(sys.argv[1]) print (path) trans(path)
運行方法同上。
json檔案是我在福士點評抓取的資料,儲存格式為utf-8.如果讀取資料有問題的話,可以修改其中一句代碼:
jsonData=open(path+'.json',encoding='utf-8')
這樣應該就沒有問題了。
歡迎交流討論。
參考資料:
csv.writer寫入檔案有多餘的空行
查看評論