今天遇到需要判斷在輸入框中輸入全形與半形的文字個數,例如全形可以輸入10個,而半形可以輸入20個。在網上搜尋了下,有篇文章是關於Javascript,重點在於將字串轉換成unicode編碼,而AS和Javascript有現成的charCodeAt()函數。
並不是所有的0-255之間的Unicode都是1個位元組長的!!而且,日文的假名有半形的形式(Unicode是65377-65439,其中
65381除外)!!,並不是只有這些是半形的,還有很多字元也是半形的!!所以說,僅僅靠判斷是不是在0-255裡面是不行的。
考慮到Unicode包括了所有國家的各種字元,而且這些字元又是全形半形交雜的,所以,不會有一個完美的JS方法來進行半形字元的校正。但是因為一般別
的字元也用不上,以後做的多是對日項目,所以還是沿用0-255的方法,然後摳掉一些全形的,再加上對半形日文的校正,寫成以下一個方法,供研究使用:
function calcUTFByte(str)<br />{<br /> var len=0;<br /> for (var i=0;i<str.length;i++) {<br /> var temp = str.charCodeAt(i);<br /> if ( temp >= 0 && temp <= 254) {<br /> //以下是0-255之內為全形的字元<br /> if ( temp == 162<br /> || temp == 163<br /> || temp == 167<br /> || temp == 168<br /> || temp == 171<br /> || temp == 172<br /> || temp == 175<br /> || temp == 176<br /> || temp == 177<br /> || temp == 180<br /> || temp == 181<br /> || temp == 182<br /> || temp == 183<br /> || temp == 184<br /> || temp == 187<br /> || temp == 215<br /> || temp == 247) {<br /> len+=2;<br /> }<br /> len++;<br /> } else if ( temp >= 65377 && temp <= 65439) {<br /> if ( temp == 65381 ) {<br /> len+=2;<br /> }<br /> len++;<br /> } else {<br /> len+=2;<br /> }<br /> }//for end<br /> return len;<br />}
該文章轉自:http://hi.baidu.com/txzw/blog/item/de3a25c7f6476ed6d000601e.html