python編碼處理:unicode位元組串轉成中文 各種字串舉例說明

來源:互聯網
上載者:User

編碼問題一直是很頭痛的問題:

 

當字串是:'\u4e2d\u56fd' 

>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']
>>>str=s[0].decode('unicode_escape')  #.encode("EUC_KR")
>>>print str

中國

 

當字串是:' 东亚学团一中'

>>>print unichr(19996)

ord()支援unicode,可以顯示特定字元的unicode號碼,如:

>>>print ord('A')65

只要和Unicode串連,就會產生Unicode字串。如:

>>> 'help''help'>>> 'help,' + u'python'     u'help,python'

 

對於ASCII(7位)相容的字串,可和內建的str()函數把Unicode字串轉換成ASCII字串。如:

>>> str(u'hello world')'hello world'

 

 

對幾個概念的理解:

ASCII碼:    用資料字 對應 相應的字元

 

而中文 就是區位碼對應漢字    如:“好” 的ASCII碼為: 22909

 

unicode 編碼 每個國家分一塊。   它有UTF-8、UTF-16、UTF-32等形式

中文範圍 4E00-9FBF:  這個範圍內有 gbk,gb2312,

 

utf-8是基於unicode的 國際化的場合適合使用
gb2312和gb2312都是國標碼 出現的較早 主要用於編解碼常用漢字

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.