unicode的UTF-16BE和UTF-16LE

最後更新：2018-12-05 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

我這裡寫了一個例子，把字串”我是好人”，以unicode編碼寫入到文本中，用InputStreamReader以”UTF-16LE”編碼讀取，輸出的結果為：“???絙?”，而以“UTF-16BE”編碼讀取，結果則是“?我是好人”，檔案大小顯示為10位元組。我的理解是，如果程式中指定使用unicode編碼，但是沒有指定位元組順序，程式會用java預設的UTF-16BE進行編碼，並且，會輸出標誌位FEFF。所以檔案中多了兩個位元組。而讀取的時候，使用unicode編碼讀取，程式不知道使用的是哪一種位元組順序，先讀取開頭的FEFF，結果表明是採用的UTF-16BE編碼，接下來再繼續解析，就得到正確字元。而如果指定使用UTF-16LE編碼，因為已經包含了位元組順序，所以就直接從位元組數組中讀取形成字串，就出現了五個字元，而且由於編碼格式不一樣，除了‘好‘和‘絙’的編碼剛好高低位倒置，還可以形成字元，其餘全都是亂碼。而使用UTF-16BE編碼讀取，因為已經制定了位元組順序，所以，也就不去讀取標誌位，那麼就把unicode中無法編碼的FEFF解碼成為了‘?’。

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

unicode的UTF-16BE和UTF-16LE

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support