python中文編碼問題小結

來源:互聯網
上載者:User
中文編碼問題一直是Python程式設計中很頭痛的問題,本文對此較為詳細的進行了總結歸納。具體如下:

當字串是:'\u4e2d\u56fd'

>>>s=['\u4e2d\u56fd','\u6e05\u534e\u5927\u5b66']>>>str=s[0].decode('unicode_escape') #.encode("EUC_KR")>>>print str中國

當字串是:' 东亚学团一中'

>>>print unichr(19996)東

ord()支援unicode,可以顯示特定字元的unicode號碼,如:

>>>print ord('A')65

只要和Unicode串連,就會產生Unicode字串。如:

>>> 'help''help'>>> 'help,' + u'python'   u'help,python'

對於ASCII(7位)相容的字串,可和內建的str()函數把Unicode字串轉換成ASCII字串。如:

>>> str(u'hello world')'hello world'

對幾個概念的理解:

ASCII碼 用資料字 對應 相應的字元 如所示:

而中文 就是區位碼對應漢字。如:“好” 的ASCII碼為: 22909

unicode 編碼 每個國家分一塊。它有UTF-8、UTF-16、UTF-32等形式
中文範圍 4E00-9FBF:這個範圍內有 gbk,gb2312,

utf-8是基於unicode的 國際化的場合適合使用

gb2312和gb2312都是國標碼 出現的較早 主要用於編解碼常用漢字

希望本文所述對大家的Python程式設計有所協助。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.