unicode的UTF-16BE和UTF-16LE

來源:互聯網
上載者:User

我這裡寫了一個例子,把字串”我是好人”,以unicode編碼寫入到文本中,用InputStreamReader以”UTF-16LE”編碼讀取,輸出的結果為:“???絙?”,而以“UTF-16BE”編碼讀取,結果則是“?我是好人”,檔案大小顯示為10位元組。我的理解是,如果程式中指定使用unicode編碼,但是沒有指定位元組順序,程式會用java預設的UTF-16BE進行編碼,並且,會輸出標誌位FEFF。所以檔案中多了兩個位元組。而讀取的時候,使用unicode編碼讀取,程式不知道使用的是哪一種位元組順序,先讀取開頭的FEFF,結果表明是採用的UTF-16BE編碼,接下來再繼續解析,就得到正確字元。而如果指定使用UTF-16LE編碼,因為已經包含了位元組順序,所以就直接從位元組數組中讀取形成字串,就出現了五個字元,而且由於編碼格式不一樣,除了‘好‘和‘絙’的編碼剛好高低位倒置,還可以形成字元,其餘全都是亂碼。而使用UTF-16BE編碼讀取,因為已經制定了位元組順序,所以,也就不去讀取標誌位,那麼就把unicode中無法編碼的FEFF解碼成為了‘?’。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.