昨天,在寫代碼時我遇到了一個中文字串截取的問題,原本是想直接用substr()來,但這個是在單位元組符下用的,對於多位元組編碼的漢字或是其它語言字元中,這個函數可能就用不上了,而且會容易截出亂碼來! 現在就把我的下工作記錄和總結給大家分享一下:問題產生及使用案例網站:天氣預報15天查詢(http://tqybw.net)問題時間:2013-10-31 解決思路:把漢字按一個漢字在編碼下按其在完整性正則分割成數組,再根據需要取截取長度; 1、實現方法函數 開啟mbstring擴充,然後自訂函數:
<?php header('content-Type:text/html:charset=utf-8'); function substr_chinese($str, $start, $length = null) { return join("", array_slice( preg_split("//u", $str, -1, PREG_SPLIT_NO_EMPTY), $start, $length) ); } (PS:^_^不錯的php學習交流群:276167802,驗證:csl,謝謝!) //執行個體 $str = "中國地圖全圖"; echo substr_utf8($str, 0, 4); //輸出: 中國地圖 ?>
2、主要函數功能說明preg_split:對於初學者來說,大家對 說明 array preg_split ( string $pattern, string $subject [, int $limit [, int $flags]] )返回一個數組,包含 subject 中沿著與 pattern 匹配的邊界所分割的子串。如果指定了 limit,則最多返回 limit 個子串,如果 limit 是 -1,則意味著沒有限制,可以用來繼續指定選擇性參數 flags。flags 可以是下列標記的任意組合(用按位或運算子 組合):PREG_SPLIT_NO_EMPTY如果設定了本標記,則 preg_split() 只返回非空的成分。PREG_SPLIT_DELIM_CAPTURE如果設定了本標記,定界符模式中的括號運算式也會被捕獲並返回。本標記添加於 PHP 4.0.5。PREG_SPLIT_OFFSET_CAPTURE如果設定了本標記,如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字串位移量。注意這改變了返回的數組的值,使其中的每個單元也是一個數組,其中第一項為匹配字串,第二項為其在 subject 中的位移量。本標記自 PHP 4.3.0 起可用。 提示如果不需要Regex的功能,可以選擇使用更快(也更簡單)的替代函數如 explode() 或 str_split()。 3、array_slice說明:array_slice() 函數在數組中根據條件取出一段值,並返回。
<?php $a=array(0=>"Dog",1=>"Cat",2=>"Horse",3=>"Bird"); print_r(array_slice($a,1,2)); ?> 輸出:Array ( [0] => Cat [1] => Horse )
本文講述了PHP 中文字串截取無亂碼方法,希望本文能給讀者帶來靈感,協助讀者解決疑問,感謝閱讀本文。