Javascript判斷日文全形半形長度

來源:互聯網
上載者:User

    今天遇到需要判斷在輸入框中輸入全形與半形的文字個數,例如全形可以輸入10個,而半形可以輸入20個。在網上搜尋了下,有篇文章是關於Javascript,重點在於將字串轉換成unicode編碼,而AS和Javascript有現成的charCodeAt()函數。

 

    並不是所有的0-255之間的Unicode都是1個位元組長的!!而且,日文的假名有半形的形式(Unicode是65377-65439,其中
65381除外)!!,並不是只有這些是半形的,還有很多字元也是半形的!!所以說,僅僅靠判斷是不是在0-255裡面是不行的。

    

考慮到Unicode包括了所有國家的各種字元,而且這些字元又是全形半形交雜的,所以,不會有一個完美的JS方法來進行半形字元的校正。但是因為一般別
的字元也用不上,以後做的多是對日項目,所以還是沿用0-255的方法,然後摳掉一些全形的,再加上對半形日文的校正,寫成以下一個方法,供研究使用:

 

function calcUTFByte(str)<br />{<br /> var len=0;<br /> for (var i=0;i<str.length;i++) {<br /> var temp = str.charCodeAt(i);<br /> if ( temp >= 0 && temp <= 254) {<br /> //以下是0-255之內為全形的字元<br /> if ( temp == 162<br /> || temp == 163<br /> || temp == 167<br /> || temp == 168<br /> || temp == 171<br /> || temp == 172<br /> || temp == 175<br /> || temp == 176<br /> || temp == 177<br /> || temp == 180<br /> || temp == 181<br /> || temp == 182<br /> || temp == 183<br /> || temp == 184<br /> || temp == 187<br /> || temp == 215<br /> || temp == 247) {<br /> len+=2;<br /> }<br /> len++;<br /> } else if ( temp >= 65377 && temp <= 65439) {<br /> if ( temp == 65381 ) {<br /> len+=2;<br /> }<br /> len++;<br /> } else {<br /> len+=2;<br /> }<br /> }//for end<br /> return len;<br />}

 

 

 

 

該文章轉自:http://hi.baidu.com/txzw/blog/item/de3a25c7f6476ed6d000601e.html

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.