學習字型檔製作的時候需要用到這個,所以轉過來學習學習!
中國於1981年發布了《資訊處理交換用漢字編碼字元集 基本集》GB2312-80
GB2312將代碼錶分為94個區,對應第一位元組;每個區94個位,對應第二位元組,兩
個位元組的值分別為區號值和位號值加32(2OH),因此也稱為區位碼。01-09區為符
號、數字區,16-87區為漢字區,10-15區、88-94區是有待進一步標準化的空白區
。GB2312將收錄的漢字分成兩級:第一級是常用漢字計 3755個,置於16-55區,
按漢語拼音字母/筆形順序排列;第二級漢字是次常用漢字計3008個,置於56-87
區,按部首/筆畫順序排列。故而 GB2312最多能表示6763個漢字
漢字系統對每個漢字規定了輸入電腦的代碼,即漢字的外部碼,鍵盤輸入漢字
是輸入漢字的外部碼。電腦為了識別漢字,要把漢字的外部碼轉換成漢字的內
部碼,以便進行處理和儲存。為了將漢字以點陣的形式輸出,還要將漢字的內部
碼轉換為漢字的字形碼,確定一個漢字的點陣。並且,在電腦和其它系統或設
備需要資訊、資料交流時還必須採用交換碼。
(1) 外部碼 外部碼是電腦輸入
漢字的代碼,代表某一個漢字的一組鍵盤符號。外部碼也叫漢字輸入碼。為了建
立友好的使用者介面,輸入碼的規則必須簡單清晰、直觀易學、容易記億、操作方
便、碼位短、輸入速度快、重碼少,既符合初學者的學習,又能滿足專業輸入者
的要求,便於盲打。漢字的輸入方法不同,同一個漢字的外碼可能不一樣。人們
根據漢字的屬性(漢字字量、字形、字音、使用頻度)提出了數百種漢字外碼的編
碼方案。由於使用者不同,用途不同,各自喜愛的編碼方式也不盡相同,故對用什
麼編碼方案不能強求統一。例如拼音碼和五筆字型比較受一般使用者的歡迎。
(2)
內部碼 漢字內部碼亦稱為漢字內碼或漢字機內碼。電腦處理漢字,實際上是處
理漢字的代碼。當電腦輸入外部碼時,通常要轉成內部碼,才能進行儲存、運
算、傳送。一般用二個位元組表示一個漢字的內碼。內部碼經常是用漢字在字型檔中
的物理位置表示,如漢字在字型檔中的序號或漢字在字型檔中的儲存位置表示。注意
一般情況下,漢字的內部碼不能與西文字元編碼(ACSII碼、EBCDIC碼等)發生衝突
,並容易區分漢字與西文字元;儘可能佔用少的位元組表示儘可能多的漢字;與標
准交換碼相容(與交換碼有儘可能簡單明確的對應關係;運算時不產生二義性和不
確定性)。 除了二位元組漢字內部碼外,還有三位元組內部碼、四位元組內部碼、帶引
導碼的漢字內部碼、帶符號的漢字內部碼、帶括弧的漢字內部碼等。
(3) 交換碼
當電腦之間或與終端之間進行資訊交換時,要求它們之間傳送的漢字代碼資訊
完全一致,國家規定了資訊交換用的標準漢字交換碼"GB312-80資訊交換用漢字編
碼字元集(基本集)",即國標碼。國標碼共收集了7445個圖形字元,其中漢字6763
個,一般符號、數字、拉丁字母、希臘字母、漢語拼音等709個。
(4) 漢字輸出
碼 又稱漢字字形碼或漢字發生器的編碼。為輸出漢字,對漢字字形經過點陣的數
字化後的一串位元稱為漢字輸出碼。
漢字內部碼:漢字在電腦內的編碼(簡稱內碼)
ASCII碼用1個位元組(最左邊位為0)表示1個英文字元
漢字用兩個位元組(共16位位元編碼)表示, 兩位元組首位都是“1” ,這種漢
字編碼最多可以表示 27×27=128×128=16384個漢字
字型碼是一些漢字輸入軟體所定義的漢字編碼規則,是把漢字抽象為一些字根(
字型)組合出來的,根據書寫規則編碼。
#等級考試