1) ASCII(American Standard Code for Information Interchange,美國資訊交換標準碼)是使用最廣的。使用ASCII碼編碼的檔案稱為ASCII檔案。標準的ASCII編碼使用7個位元來表示128個符號,包括英文大小寫字母、標點符號、數字和特殊控制符。
2) ANSI(American National Institute,美國國家標準協會)編碼使用8位位元來表示每個字元。8個位元能表示256個資訊單元,因此,該編碼可以對256個字元、符號等進行編碼。ANSI開始的128個字元的編碼和ASCII定義的一樣,只是在最高位上加個0。例如,在ASCII編碼中,字元"A"表示為1000001,而在ANSI編碼中,則用01000001表示。除了表示ASCII編碼中的128個字元外,ANSI編碼還有128個符號可以表示,如著作權符、英鎊符、外國語言字元等。
3)EBCDIC(Extended Binary-Coded Decimal Interchange Code,擴充二、十進位交換碼)是IBM公司為它的大型主機開發的8位字元編碼。值得注意的是,在EBCDIC編碼開始的128個字元中,EBCDIC的編碼和ASCII或ANSI的編碼並不相同。
總的來說,標準的ASCII編碼定義的128個字元,對於表示數字、字元、標點符號和特殊字元來說是足夠了。ANSI編碼錶示了所有的ASCII編碼所表示的128個字元,並且還表示了歐洲語言中的字元。EBCDIC編碼錶示了標準的字元和控制碼。但是,沒有一種編碼方案支援可選的字元集,也不支援非字母組合起來的語言,如漢語、日語等。
4)Unicode編碼是一組16位編碼,可以表示超過65000個不同的資訊單元。從原理上講,Unicode可以表示現在正在使用的、或者已經不再使用的任何語言中的字元。對於國際商業和通訊來說,這種編碼方式是非常有用的,因為在一個檔案中可能需要包含有漢語、日語、英語等不同的語種。並且,Unicode編碼還適用於軟體的本地化,即可以針對特定的國家修改軟體。另外,使用Unicode編碼,軟體開發人員可以修改螢幕的提示、菜單和錯誤資訊提示等,來適用於不同國家的語言文字。