關於python中文處理

來源:互聯網
上載者:User

昨天偶然幫韓小玲童鞋解決python的中文問題,修複了我的一個錯誤理解,首先感謝韓某提供寶貴的機會!

 

處理中文,歸結於解碼編碼,總的方針是,先用字串自身的編碼格式解碼為unicode,然後從unicode再編碼成你需要的格式,比如gb2312

舉個例子:

s= '中文'

直接print s 會報錯,原因略

我現在想把它用gbk的格式列印出來。

首先,檢查s的編碼類別型,python有個庫,叫ch什麼的,檢測一下,比如說是gb2312格式的,則第一步,先解碼為unicode:

s.decode('gb2312')  或者 unicode(s,'gb2312')

第二步,編碼為你想輸出的類型,本例為gbk

s.decode('gb2312').encode('gbk')

這樣再列印出來應該就ok了。

另外,作業系統是中文的或是英文的,有影響。

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.