Python——UnicodeEncodeError: 'ascii' codec can't encode/decode characters__Python

來源:互聯網
上載者:User

初學Python被編碼格式搞的很頭大,以下bug是遇到的編碼問題之一:

【BUG】UnicodeEncodeError: 'ascii' codec can't encode characters in position 0-15: ordinal not in range(128)或者UnicodeDecodeError: 'ascii' codec can't decode byte 0x?? in position 1: ordinal not in range(128)

在python在安裝時,預設的編碼是ascii,當程式中出現非ascii編碼時,python的處理常常會報這樣的錯,python沒辦法處理非ascii編碼的,此時需要自己設定將python的預設編碼,一般設定為utf8的編碼格式。

查詢系統預設編碼可以在解譯器中輸入以下命令: Python代碼   >>>sys.getdefaultencoding()  

設定預設編碼時使用: Python代碼   >>>sys.setdefaultencoding('utf8')  

 可能會報AttributeError: 'module' object has no attribute 'setdefaultencoding'的錯誤,執行reload(sys),在執行以上命令就可以順利通過。

此時在執行sys.getdefaultencoding()就會發現編碼已經被設定為utf8的了,但是在解譯器裡修改的編碼只能保證當次有效,在重啟解譯器後,會發現,編碼又被重設為預設的ascii了,那麼有沒有辦法一次性修改程式或系統的預設編碼呢。

 

有2種方法設定python的預設編碼:

一個解決的方案在程式中加入以下代碼: Python代碼   import sys   reload(sys)   sys.setdefaultencoding('utf8')   

 另一個方案是在python的Lib\site-packages檔案夾下建立一個sitecustomize.py,內容為: Python代碼   # encoding=utf8   import sys      reload(sys)   sys.setdefaultencoding('utf8')   

此時重啟python解譯器,執行sys.getdefaultencoding(),發現編碼已經被設定為utf8的了,多次重啟之後,效果相同,這是因為系統在python啟動的時候,自行調用該檔案,設定系統的預設編碼,而不需要每次都手動的加上解決代碼,屬於一勞永逸的解決方案。

 

另外有一種解決方案是在程式中所有涉及到編碼的地方,強制編碼為utf8,即添加代碼encode("utf8"),這種方法並不推薦使用,因為一旦少寫一個地方,將會導致大量的錯誤報表。

【轉】http://shirley-ren.iteye.com/blog/1018750

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.