php擷取中文字串長度的方法

來源:互聯網
上載者:User
  1. $str = 'Hello world!';
  2. echo strlen($str); // 輸出12
  3. ?>
複製代碼

然而在PHP內建的函數中,strlen及mb_strlen都是通過計算字串所佔位元組數來計算長度的,在不同的編碼情況下,中文所佔的位元組數是不同的。在GBK/GB2312下,中文字元佔2個位元組,而在UTF-8下,中文字元佔3個位元組。

  1. $str = '你好,世界!';
  2. echo strlen($str); // GBK或GB2312下輸出12,UTF-8下輸出18
  3. ?>
複製代碼

而我們在判斷字串長度時往往需要判斷的是字元的數量,而非字串所佔位元組數,如在UTF-8下的這段php代碼:

  1. $name = '張耕暢';
  2. $len = strlen($name);
  3. // 輸出 FALSE,因為在UTF-8下三個中文佔9個位元組
  4. if($len >= 3 && $len <= 8){
  5. echo 'TRUE';
  6. }else{
  7. echo 'FALSE';
  8. }
  9. ?>
複製代碼

那麼有什麼方便而實用的方法可以獲得含中文字串的長度呢?可以用正則計算出中文字元的個數,在GBK/GB2312編碼下除以2,UTF-8編碼下則除以3,最後再加上非中文字串的長度,但這樣未免太過麻煩,WordPress中有一段更漂亮的代碼,借鑒如下:

  1. $str = 'Hello,世界!';
  2. preg_match_all('/./us', $str, $match);
  3. echo count($match[0]); // 輸出9
  4. ?>
複製代碼

用Regex將字串分割成單個字元,並直接用count計算出匹配到的字元數,便得到我們想要的結果了。

  • 聯繫我們

    該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

    如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

    A Free Trial That Lets You Build Big!

    Start building with 50+ products and up to 12 months usage for Elastic Compute Service

    • Sales Support

      1 on 1 presale consultation

    • After-Sales Support

      24/7 Technical Support 6 Free Tickets per Quarter Faster Response

    • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.