python中文字串編碼問題

來源:互聯網
上載者:User

標籤:中文字串   ascii   完美解決   解析失敗   pytho   logs   問題   字元集   json   

介面測試的時候,發現介面返回內容是uncodie類型但是包含中文。在使用print進行列印時輸出提示錯誤:

UnicodeEncodeError: ‘ascii‘ codec can‘t encode characters in position 733-738: ordinal not in range(128)

查閱資料發現是由於內容中包含了中文字元,導致unix系統在print解析是無法正常解析導致。

源碼如下:

def _ejson(con):    comm = "echo ‘%s‘ | python -m json.tool" % con    return os.system(comm)if __name__ == "__main__":    con =open(‘con.json‘,‘r‘)    print _ejson(con)

經過查閱資料以及自我檢查

發現con返回的是unicode編碼的字串,其中包換中文。導致print的時候解析失敗。

更改後的代碼如下:

def _ejson(con):    con = con.encode(‘utf-8‘)    comm = "echo ‘%s‘ | python -m json.tool" % con    return os.system(comm)if __name__ == "__main__":    con =open(‘con.json‘,‘r‘)    print _ejson(con)

問題得到完美解決。

附帶簡單說下python編碼的問題:

Python 有兩種字串類型,str 與 unicode:

因為 Python 認為 16 位的 unicode 才是字元的唯一內碼,而大家常用的字元集如 gb2312,gb18030/gbk,utf-8,以及 ascii 都是字元的二進位(位元組)編碼形式。

如果需要將非unicode的編碼的str轉換成unicode編碼,則需要使用decode進行解碼,反之如果希望把unicode編碼轉換成其他字元集則需要使用encode進行編碼。

例如:str.decode(‘utf-8‘) 將str轉換成unicode編碼

   str.encode(‘utf-8‘)將str轉換成utf-8編碼

通常情況下,我們需要通過unicode編碼進行中轉換,進行不同類型編碼的相互之間轉換

例如:str.decode(‘gbk‘).encode(‘utf-8‘) 將str由gbk編碼變成utf-8編碼

 

 

 



python中文字串編碼問題

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.