標籤:
java 採用Unicode來表示字元,每個字元(包括中文字元)都有兩個位元組
如下是java基本類型的位元組數,注意不要與C的弄混了
int 4
short 2
long 8
byte 1
float 4
double 8
char 2
boolean 2
gb2312/gbk 都是兩個位元組,UTF-8是三個位元組
如:
public class Test { public static void main(String[] args) { String str= "中"; char x =‘中‘; byte[] bytes=null; byte[] bytes1=null; byte[] byte2=null; try { bytes = str.getBytes("utf-8"); byte2=str.getBytes(); bytes1 = charToByte(x); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } System.out.println("bytes 大小:"+bytes.length); System.out.println("bytes1大小:"+bytes1.length); System.out.println("bytes2大小:"+byte2.length); } public static byte[] charToByte(char c) { byte[] b = new byte[2]; b[0] = (byte) ((c & 0xFF00) >> 8); b[1] = (byte) (c & 0xFF); return b; }}
運行結果:
bytes 大小:3
bytes1大小:2
bytes2大小:3
本機eclipse 的編碼設定為 UTF-8, 所以這裡是三個位元組
java 資料類型與基本編碼