標籤:字元 無法 utf-16 style ram 編碼格式 unicode ati ring
到網上不少地方傳輸中文的時候用的是類似/u4e2d/u56fd的字元,就是Unicode編碼的字元,想知道具體什麼內容,又不容易看出來,所以想把這個字元集解碼為正常的字元。
開始我通過Encoding轉換編碼格式,發現行不通,怎麼都不能正常解開,然後在網上淘了些類似的解碼方案,有可行的,不過我發現寫的有點麻煩,而且如果我成批的Unicode字元就無法直接輸出了,然後我看呀看呀看,終於,我發現了char類的兩個方法:一個是char.ConvertFromUtf32,注釋說:將指定的Unicode碼位轉換為UTF-16編碼字串,這不就是解碼的嗎;還有一個是char.ConvertToUtf32,注釋說:該方法是將字串中指定位置的UTF-16編碼字元轉換為Unicode碼位,哈,其實就是把普通的字元轉換為Unicode字元集。
// <summary> /// 把Unicode解碼為普通文字 /// </summary> /// <param name="unicodeString">要解碼的Unicode字元集</param> /// <returns>解碼後的字串</returns> public static string ConvertToGB(string unicodeString) { string[] strArray = unicodeString.Split(new string[] { @"\u" }, StringSplitOptions.None); string result = string.Empty; for (int i = 0; i < strArray.Length; i++) { if (strArray[i].Trim() == "" || strArray[i].Length < 2 || strArray.Length <= 1) { result += i == 0 ? strArray[i] : @"\u" + strArray[i]; continue; } for (int j = strArray[i].Length > 4 ? 4 : strArray[i].Length; j >= 2; j--) { try { result += char.ConvertFromUtf32(Convert.ToInt32(strArray[i].Substring(0, j), 16)) + strArray[i].Substring(j); break; } catch { continue; } } } return result; } /// <summary> /// 把漢字字元轉碼為Unicode字元集 /// </summary> /// <param name="strGB">要轉碼的字元</param> /// <returns>轉碼後的字元</returns> public static string ConvertToUnicode(string strGB) { char[] chs = strGB.ToCharArray(); string result = string.Empty; foreach (char c in chs) { result += @"\u" + char.ConvertToUtf32(c.ToString(), 0).ToString("x"); } return result; }
C# Unicode字元集批量轉碼為漢字(互轉)