關鍵字:JavaScript 漢字轉換為Unicode編碼 Unicode編碼轉換為漢字
JavaScript 漢字Unicode編碼相互轉碼。
JavaScript庫
-JavaScriptvar GB2312UnicodeConverter={
ToUnicode:function(str){
return escape(str).toLocaleLowerCase().replace(/%u/gi,'\\u');
}
,ToGB2312:function(str){
return unescape(str.replace(/\\u/gi,'%u'));
}
};
測試代碼
-HTML<html><head><meta http-equiv="content-type" content="text/html" /></head><body><script>
var GB2312UnicodeConverter={
ToUnicode:function(str){
return escape(str).toLocaleLowerCase().replace(/%u/gi,'\\u');
}
,ToGB2312:function(str){
return unescape(str.replace(/\\u/gi,'%u'));
}
};
//=============測試代碼
var str='上海',unicode;
document.write(str+'<br/>');
unicode=GB2312UnicodeConverter.ToUnicode(str);
document.write('漢字轉換為Unicode代碼:'+unicode+'<br/><br/>');
document.write('Unicode代碼轉換為漢字:'+GB2312UnicodeConverter.ToGB2312(unicode));
</script> </body></html>
關鍵字:C# 漢字轉換為Unicode編碼 Unicode編碼轉換為漢字
Unicode和漢字編碼小知識
將漢字進行UNICODE編碼,如:“王”編碼後就成了“\u738b”,UNICODE字元以\u開始,後面有4個數字或者字母,所有字元都是16進位的數字,每兩位表示的256以內的一個數字。而一個漢字是由兩個字元組成,於是就很容易理解了,“738b”是兩個字元,分別是“73”“8b”。但是在將 UNICODE字元編碼的內容轉換為漢字的時候,字元是從後面向前處理的,所以,需要把字元按照順序“8b”“73”進行組合得到漢字。
下面是C#漢字Unicode編碼相互轉碼。
-C#using System;
using System.Text;
using System.Text.RegularExpressions;
using System.Globalization;
public class GB2312UnicodeConverter
{
/// <summary>
/// 漢字轉換為Unicode編碼
/// </summary>
/// <param name="str">要編碼的漢字字串</param>
/// <returns>Unicode編碼的的字串</returns>
public static string ToUnicode(string str)
{
byte[] bts = Encoding.Unicode.GetBytes(str);
string r = "";
for (int i = 0; i < bts.Length; i += 2) r += "\\u" + bts[i + 1].ToString("x").PadLeft(2, '0') + bts[i].ToString("x").PadLeft(2, '0');
return r;
}
/// <summary>
/// 將Unicode編碼轉換為漢字字串
/// </summary>
/// <param name="str">Unicode編碼字串</param>
/// <returns>漢字字串</returns>
public static string ToGB2312(string str)
{
string r = "";
MatchCollection mc = Regex.Matches(str, @"\\u([\w]{2})([\w]{2})", RegexOptions.Compiled | RegexOptions.IgnoreCase);
byte[] bts = new byte[2];
foreach(Match m in mc )
{
bts[0] = (byte)int.Parse(m.Groups[2].Value, NumberStyles.HexNumber);
bts[1] = (byte)int.Parse(m.Groups[1].Value, NumberStyles.HexNumber);
r += Encoding.Unicode.GetString(bts);
}
return r;
}
} Tip:貌似在.NET 4.0中unicode轉漢字是有編譯器直接完成的——!