Python的經典問題——中文亂碼

來源:互聯網
上載者:User
關鍵字:Python UTF-8 GBK 中文 亂碼

估計入門時都會遇到的。我是在windows下用的Python25內建的IDLE編輯啟動並執行,發現運行指令碼得出的結果有一些中文顯示是亂碼,但有一些是正常的。百思不得其解。首先查看了一下源檔案的編碼格式,是UTF-8。經過搜尋再搜尋,調試再調試,也換了幾個編譯器,發現比IDLE還糟糕(可能需要進行encode設定)。問題終於解決了,一共花了俺將近5個小時,寫在這裡,希望遇到問題的人能搜尋到這裡,不再重犯。

亂碼原因:
因為你的檔案聲明為utf-8,並且也應該是用utf-8的編碼儲存的源檔案。但是windows的本地預設編碼是cp936,也就是gbk編碼,所以在控制台直接列印utf-8的字串當然是亂碼了。

解決方案:

在控制台列印的地方用一個轉碼就ok了,列印的時候這麼寫:

print myname.decode('UTF-8').encode('GBK')

比較通用的方法應該是:

import sys
type = sys.getfilesystemencoding()
print myname.decode('UTF-8').encode(type)

 

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.