python學習(2)關於字元編碼

來源:互聯網
上載者:User

標籤:odi   行記錄   輸入   支援   字元編碼   標準   python學習   and   can   

關於字元編碼的學習內容筆記如下:

1、電腦只能用0和1來進行記錄和儲存。電腦是二進位。

2、ASCII(American Standard Code for Information Interchange,美國標準資訊交換代碼)是基於拉丁字母的一套電腦編碼系統,主要用於顯示現代英語和其他西歐語言,其最多隻能用 8 位來表示(一個位元組),即:2**8 = 256-1,所以,ASCII碼最多隻能表示 255 個符號。一個英文或者英文符號佔一個位元組。

3、1980年中國為瞭解決電腦輸入的問題,制定了GB2132編碼。2000年後大幅度擴充成為GB18030。解決了漢字輸入問題。

4、ASCII碼無法將世界上的各種文字和符號全部表示,所以,就需要新出一種可以代表所有字元和符號的編碼,即:Unicode。Unicode(統一碼、萬國碼、單一碼)是一種在電腦上使用的字元編碼。Unicode 是為瞭解決傳統的字元編碼方案的局限而產生的,它為每種語言中的每個字元設定了統一併且唯一的二進位編碼,規定雖有的字元和符號最少由 16 位來表示(2個位元組),即:2 **16 = 65536。Unicode中,一個英文字元佔一個位元組,一個中文字元佔2個位元組。

5、UTF-8是對Unicode編碼的壓縮和最佳化,他不再使用最少使用2個位元組,而是將所有的字元和符號進行分類:ascii碼中的內容用1個位元組儲存、歐洲的字元用2個位元組儲存,東亞的字元用3個位元組儲存

6、Python2.7預設支援ascii碼,因此會出現中文字元輸出的問題。需要加上# -*- coding: utf-8 -*-來告訴解譯器,用什麼字元編碼。Python3以上預設採用UTF-8編碼,無需加# -*- coding: utf-8 -*-。

python學習(2)關於字元編碼

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.