根據前一篇的補充問題http://blog.csdn.net/fancylovejava/article/details/10142391
有了前一篇文章的瞭解,大概瞭解了unicode編碼格式了
ANSI:漢字區的內碼範圍高位元組從B0-F7,低位元組從A1-FE
Unicode:漢字的Unicode編碼範圍為\u4E00-\u9FA5 \uF900-\uFA2D,如果不在這個範圍內就不是漢字了.
現在程式中遇到的問題是,伺服器端發送中文給android用戶端的時候,android用戶端擷取到字串然後顯示到介面上,可是顯示的結果是
unicode編碼格式开始兑奖所以呢,這要轉換啊
有相關的網站工具轉換unicode編碼和asicc編碼,http://tool.chinaz.com/Tools/Unicode.aspx
jdk有一個工具也提供轉換,是native2ascii.exe,在bin目錄下面,直接點開輸入中文就可以了
有篇比較好的文章介紹http://sailinglee.iteye.com/blog/430568
可是我們要在程式中將這個些开轉換成中文啊~~~~
String a="開始兌獎";
System.out.println(a.codePointAt(0));
這個列印出來的是“開”字的开unicode碼的數字部分24320
System.out.println((char)24320);
這個列印出來的是將一個數字轉換成一個char類型,這個char類型就是一個代表這個unicode碼的中文字元,
列印出來結果為:開
有了這個就可以將unicode轉換成中文了
還有篇文章很好,轉過來http://blog.csdn.net/ocean20/article/details/6743385說明下char這個字元型在java中
java中的char占幾個位元組
1:“位元組”是byte,“位”是bit ;
2: 1 byte = 8 bit ;
char 在java中是2個位元組。java採用unicode,2個位元組(16位)來表示一個字元。
例子代碼如下:
[java] view plain copy public class Test { public static void main(String[] args) { String str= "中"; char x ='中'; byte[] bytes=null; byte[] bytes1=null; try { bytes = str.getBytes("utf-8"); bytes1 = charToByte(x); } catch (UnsupportedEncodingException e) { // TODO Auto-generated catch block e.printStackTrace(); } System.out.println("bytes 大小:"+bytes.length); System.out.println("bytes1大小:"+bytes1.length); } public static byte[] charToByte(char c) { byte[] b = new byte[2]; b[0] = (byte) ((c & 0xFF00) >> 8); b[1] = (byte) (c & 0xFF); return b; } }
運行結果:
bytes 大小:3
bytes1大小:2
java是用unicode來表示字元,"中"這個中文字元的unicode就是2個位元組。
String.getBytes(encoding)方法是擷取指定編碼的byte數組表示,
通常gbk/gb2312是2個位元組,utf-8是3個位元組。
如果不指定encoding則取系統預設的encoding。