php正則匹配漢字!
/^[\x{4e00}-\x{9fa5}]+$/u
以上這個Regex就是困擾了很多php程式員的匹配漢字的Regex
大家可能會覺得很簡單,實際上不同編碼,不同程式語言,都有些細微的出入,稍不注意就得不到正確的結果。
下面是utf-8編碼的例子:
$str = "漢字";
if (preg_match("/^[\x{4e00}-\x{9fa5}]+$/u",$str)) {
print("該字串全部是中文");
} else {
print("該字串不全部是中文");
}
下面的例子包含gbk,gb2312的例子:
<?php
$action = trim($_GET['action']);
if($action == "sub")
{
$str = $_POST['dir'];
//if(!preg_match("/^[".chr(0xa1)."-".chr(0xff)."A-Za-z0-9_]+$/",$str)) //GB2312漢字字母數字底線Regex
if(!preg_match("/^[\x{4e00}-\x{9fa5}A-Za-z0-9_]+$/u",$str)) //UTF-8漢字字母數字底線Regex
{
echo "<font color=red>您輸入的[".$str."]含有違法字元</font>";
}
else
{
echo "<font color=green>您輸入的[".$str."]完全合法,通過!</font>";
}
}
?>
<form method="POST" action="?action=sub">
輸入字元(數字,字母,漢字,底線):
<input type="text" name="dir" value="">
<input type="submit" value="提交">
</form>
來源:http://blog.csdn.net/lihaiboas1/article/details/7030735