PHP判斷字串是純英文、純漢字或漢英混合
PHP判斷字串是否為中文(或英文)的方法,除了Regex判斷和拆分字元判斷字元的值是否小於128
?
外還有一種比較特別的方法。
使用php中的mb_strlen和strlen函數判斷
方法比較簡單:分別使用以上兩個函數以當前編碼測出字元的傳回值,然後比較傳回值。
傳回值相等的為純英文、純數字、英數混排;
傳回值不等,且strlen傳回值可被mb_strlen整除的為純漢字
傳回值不等,且strlen傳回值不可被mb_strlen整除的為英漢或數漢混排
?
看一下以下的例子:
$value) { $x = mb_strlen($value,'gb2312'); $y = strlen($value); echo $strarray[$key].' '.$x.' '.$y.''; } ?> ?
運行後的結果是:
hello 5 5
123456 6 6
123hello 8 8
你好 2 4
123你好 5 7
hello你好 7 9
123hello你好 10 12
?
來源: http://007blogchina.appspot.com/?p=130001
?
HP沒有直接函數來判斷一個字串是否是純英文或純漢字以及漢英混合,只能自己寫函數。要想實現此功能就必需對字元集漢字編碼佔位進行瞭解,就目前國內比較常用的字元集當屬UTF8與GBK了。
UTF8每個漢字等於3個長度;
GBK每個漢字等於2個長度;
利用以上漢字與英文的差異,我們就可以利用mb_strlen函數與strlen函數分別計算出兩組長度數字,然後根據規律進行運算即可判斷出字串的類型了。
?
UTF-8執行個體
';function utf8_str($str){ $mb = mb_strlen($str,'utf-8'); $st = strlen($str); if($st==$mb) return '純英文'; if($st%$mb==0 && $st%3==0) return '純漢字'; return '漢英混合';} $str = '部落格';echo '字串:'.$str.',是'.utf8_str($str).'';?>?
GBK方法
function gbk_str($str){ $mb = mb_strlen($str,'gbk'); $st = strlen($str); if($st==$mb) return '純英文'; if($st%$mb==0 && $st%2==0) return '純漢字'; return '漢英混合';}?
來源: http://www.qttc.net/201207142.html
?
?
?