在javascript中如何得到中英文混合字串的長度

來源:互聯網
上載者:User

有同事在公司的OA上發了個貼子,介紹在javascript中如何得到中英文混合字串的長度。

用的是Regex。
複製代碼 代碼如下:
var str = ”坦克是tank的音譯”;
var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;

我查了一下書,有點明白了:

西文常用字元集由空格“ ”(0x20)到“~”(0x7e)構成,漢字會落在這個字元集外,而Regex[^ -~]表示除空格到“~”外的字元集。
複製代碼 代碼如下:
string.match(regex) 會以數組形式返回字串string中匹配Regexregex的子串,所以,
str.match(/[^ -~]/g)會以數組的形式返回一個個漢字。例如
var str = "dd大哥";
//顯示"大,哥",數組中返回兩個漢字,數組長度為2
alert(str.match(/[^ -~]/g));

這樣,var len = str.match(/[^ -~]/g) == null ? str.length : str.length + str.match(/[^ -~]/g).length ;就可以得到str的正確長度了。

在javascript中,一個漢字的長度也被計算為1,常常在提交到資料庫中造成長度超標的錯誤,現在用這個方法,可以在提交前先檢測一番了。

註:以上代碼有些符號有問題,經修正後,改為如下函數。
複製代碼 代碼如下:
function get_strlength (str)
{
var len = 0;

if (str.match(/[^ -~]/g) == null)
{
len = str.length;
}
else
{
len = str.length + str.match(/[^ -~]/g).length;
}

return len;
}

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.