標籤:java charset
Java中用UTF-16編碼字元(見博文Java 正確遍曆字串),Charset類建立了UTF-16編碼的位元組序列和其它字元編碼方式的位元組序列之間的映射。當從外面讀入表示字元的位元組流時,我們可以通過Charset類指定原來字元的編碼方式,好讓程式可以正確的把字元原來的位元組編碼轉化為Java自己的位元組編碼;同樣,當把字元寫出時,我們可以通過Charset指定字元的編碼方式。下面舉兩個簡單的例子來說明Charset的使用。
public void test1() {Charset charset = Charset.forName("UTF-8");try {InputStream inputStream = new FileInputStream("test1.txt");int num = inputStream.available();System.out.println("available bytes number is : " + num);byte[] bytes1 = null;if (num > 0) {bytes1 = new byte[num];System.out.println("bytes1 length is : " + bytes1.length);inputStream.read(bytes1);// charset指定的是位元組數組原來的字元編碼集System.out.println(new String(bytes1, charset));}} catch (FileNotFoundException e) {// TODO Auto-generated catch blocke.printStackTrace();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}
public void test2() {Charset charset = Charset.forName("UTF-8");try {OutputStream outputStream = new FileOutputStream("test1.txt");String compareString = "liyuncong wangfang 李";// charset指定對字串中字元編碼的字元編碼集byte[] bytes2 = compareString.getBytes(charset);outputStream.write(bytes2);} catch (FileNotFoundException e) {// TODO Auto-generated catch blocke.printStackTrace();} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}}
在Java中,Charset的正確使用是非常重要的,比如當我們從互連網上下載大量網頁時,需要發現網頁的正確編碼並在讀入時利用Charset類正確將其轉碼,否則下載的網頁就沒有任何意義了。
著作權聲明:本文為博主原創文章,未經博主允許不得轉載。
Java 使用Charset類解決讀入字元亂碼問題和控制輸出字元編碼