漢字在電腦中的表示

來源:互聯網
上載者:User

標籤:

漢字在電腦中的表示

一、一個漢字在電腦中佔兩個位元組的位置

    西文字元中的ASCII碼錶示西文字元是,用的是7位的ASCII碼,為了在電腦中儲存,最高位(第八位)預設為0,所以可以表示27個不同的字元;擴充的ASCII碼,使用的第八位,不在預設為0,所以最多可以表示28個字元。

   中文跟西文不大一樣。中文的一個漢字佔16位,也就是兩個位元組的位置。編碼方式跟ASCII碼類似,但是為了與ASCII碼區別開來,最高位預設為1.

二、漢字編碼的過程

   漢字編碼分為外碼、機內碼、字形碼、向量漢字四個階段。

   外碼是輸入碼,就像搜狗那樣的IME。機內碼有國標碼、BIG5等,這個過程是不會在電腦螢幕上顯示的。字形碼以點陣形式表示一個漢字。向量漢字是用一種軟體在螢幕上顯示漢字字形,可以隨意的放大縮小。

   國標碼是 用於電腦之間或與終端之間資訊交換時的漢字代碼(GB2312,GBK,GB18030), 由連續的兩個位元組組成,每個位元組七位有效,最高位為1。

   字形碼是確定一個漢字字形點陣的代碼, 漢字字形點陣中的每個點對應一個二進位位。

   向量漢字是用軟體描述漢字 ,向量字型檔儲存對每一個漢字的描述資訊,比如一個筆劃的起始、終止座標,半徑、弧度等等。在輸出時要經過一定的數學運算。 向量漢字可隨意放大、縮小而不變形。 Windows使用的字型檔為以上兩類。在FONTS目錄下,副檔名為FON的檔案為點陣字型檔;副檔名為TTF為向量字型檔。

三、漢字資訊處理過程

漢字在電腦中的表示

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.