Regex在 PHP 中的應用
在 PHP 應用中,Regex主要用於:
•正則匹配:根據Regex匹配相應的內容
•正則替換:根據Regex匹配內容並替換
•正則分割:根據Regex分割字串
在 PHP 中有兩類Regex函數,一類是 Perl 相容Regex函數,一類是 POSIX 擴充Regex函數。二者差別不大,而且推薦使用Perl 相容Regex函數,因此下文都是以 Perl 相容Regex函數為例子說明。
定界符
Perl 相容模式的Regex函數,其Regex需要寫在定界符中。任何不是字母、數字或反斜線()的字元都可以作為定界符,通常我們使用 / 作為定界符。具體使用見下面的例子。
提示
儘管Regex功能非常強大,但如果用一般字元串處理函數能完成的,就盡量不要用Regex函數,因為Regex效率會低得多。關於一般字元串處理函數。
preg_match()
preg_match() 函數用於進行Regex匹配,成功返回 1 ,否則返回 0 。
文法:
int preg_match( string pattern, string subject [, array matches ] )
參數說明:
| 參數 |
說明 |
| pattern |
Regex |
| subject |
需要匹配檢索的對象 |
| matches |
可選,儲存匹配結果的數組, $matches[0] 將包含與整個模式比對的文本,$matches[1] 將包含與第一個捕獲的括弧中的子模式所匹配的文本,以此類推 |
例子 1 :
複製代碼 代碼如下:
if(preg_match("/php/i", "PHP is the web scripting language of choice.", $matches)){
print "A match was found:". $matches[0];
} else {
print "A match was not found.";
}
?>
瀏覽器輸出:
複製代碼 代碼如下:
A match was found: PHP
在該例子中,由於使用了 i 修正符,因此會不區分大小寫去文本中匹配 php 。
提示
preg_match() 第一次匹配成功後就會停止匹配,如果要實現全部結果的匹配,即搜尋到subject結尾處,則需使用 preg_match_all() 函數。
例子 2 ,從一個 URL 中取得主機網域名稱 :
複製代碼 代碼如下:
// 從 URL 中取得主機名稱
preg_match("/^(http://)?([^/]+)/i","http://www.jb51.net/index.html", $matches);
$host = $matches[2];
// 從主機名稱中取得後面兩段
preg_match("/[^./]+.[^./]+$/", $host, $matches);
echo "網域名稱為:{$matches[0]}";
?>
瀏覽器輸出:
複製代碼 代碼如下:
網域名稱為:jb51.net
preg_match_all()
preg_match_all() 函數用於進行Regex全域匹配,成功返回整個模式比對的次數(可能為零),如果出錯返回 FALSE 。
文法:
int preg_match_all( string pattern, string subject, array matches [, int flags ] )
參數說明:
| 參數 |
說明 |
| pattern |
Regex |
| subject |
需要匹配檢索的對象 |
| matches |
儲存匹配結果的數組 |
| flags |
可選,指定匹配結果放入 matches 中的順序,可供選擇的標記有:
- PREG_PATTERN_ORDER:預設,對結果排序使 $matches[0] 為全部模式比對的數組,$matches[1] 為第一個括弧中的子模式所匹配的字串組成的數組,以此類推
- PREG_SET_ORDER:對結果排序使 $matches[0] 為第一組匹配項的數組,$matches[1] 為第二組匹配項的數組,以此類推
- PREG_OFFSET_CAPTURE:如果設定本標記,對每個出現的匹配結果也同時返回其附屬的字串位移量
|
下面的例子示範了將文本中所有
標籤內的關鍵字(php)顯示為紅色。
複製代碼 代碼如下:
$str = "
學習php是一件快樂的事。
所有的phper需要共同努力!
";
$kw = "php";
preg_match_all('/
([sS]*?)
/',$str,$mat);
for($i=0;$i $mat[0][$i] = $mat[1][$i];
$mat[0][$i] = str_replace($kw, ''.$kw.'', $mat[0][$i]);
$str = str_replace($mat[1][$i], $mat[0][$i], $str);
}
echo $str;
?>
正則匹配中文漢字
正則匹配中文漢字根據頁面編碼不同而略有區別:
•GBK/GB2312編碼:[x80-xff>]+ 或 [xa1-xff]+
•UTF-8編碼:[x{4e00}-x{9fa5}]+/u
例子:
複製代碼 代碼如下:
$str = "學習php是一件快樂的事。";
preg_match_all("/[x80-xff]+/", $str, $match);
//UTF-8 使用:
//preg_match_all("/[x{4e00}-x{9fa5}]+/u", $str, $match);
print_r($match);
?>
輸出:
複製代碼 代碼如下:
Array
(
[0] => Array
(
[0] => 學習
[1] => 是一件快樂的事。
)
)
http://www.bkjia.com/PHPjc/327927.htmlwww.bkjia.comtruehttp://www.bkjia.com/PHPjc/327927.htmlTechArticleRegex在 PHP 中的應用 在 PHP 應用中,Regex主要用於: 正則匹配:根據Regex匹配相應的內容 正則替換:根據Regex匹...