Regex
在PHP中有兩套Regex函數庫,兩者功能相似,只是執行效率略有差異:
一套是由PCRE(Perl Compatible Regular Expression)庫提供的。使用“preg_”為首碼命名的函數;
一套由POSIX(Portable Operating System Interface of Unix )擴充提供的(PHP預設)。使用以“ereg_”為首碼命名的函數;
PHP中,Regex有三個作用:
匹配,也常常用於從字串中析取資訊。
用新文本代替匹配文本。
將一個字串拆分為一組更小的資訊塊。
一個Regex中至少包含一個原子。
原子(一般字元,如英文字元)
元字元(有特殊功用的字元)
模式修正字元(對Regex語義的修正)
原子(Atom)
單個字元、數字,如a~z,A~Z,0~9。
模式單元,如(ABC)可以理解為由多個原子組成的大的原子。
原子表,如 [ABC]。
重新使用的模式單元,如:\\1
普通逸出字元,如:\d, \D, \w
轉義元字元,如:\*,\.
POSIXRegex
POSIXRegex全稱為Portable Operating System Interface of Unix,意為UNIX可移植操作系實現介面。
構造POSIXRegex的方法和建立數學運算式的方法一樣,也就是用多種元字元與操作符將小的運算式結合在一起來建立更大的運算式。
元字元(Meta-character)
元字元是用於構造規則運算式的具有特殊含義的字元。如果要在Regex中包含元字元本身,必須在其前加上”\”進行轉義
元字元 說明
* 0次、1次或多次匹配其前的原子
+ 1次或多次匹配其前的原子
? 0次或1次匹配其前的原子
| 匹配兩個或多個選擇 列如 [1-9]|[a-b]|[A-Z] 與其中任何匹配為ture
^ 匹配字串串首的原子 例如 abscd===^afdgfgf 相匹配
$ 匹配字串串尾的原子 例如 dasdsv===v$
[] 匹配方括弧中的任一原子 例如 s===[dsadas]
[^] 匹配除方括弧中的原子外的任何字元 例如 aaaaa===[dddd]
{m} 表示其前原子恰好出現m次
{m,n} 表示其前原子至少出現m次,至少出現n次(n>m)
{m,} 表示其前原子出現不少於m次
() 整體表示一個原子
. 匹配除換行之外的任何一個字元
^ $ 這兩個原字元在一起稱為定界
abd===^abc$ 只有這樣才匹配
模式比對的順序
順序 元字元 說明
1 () 模式單元
2 ?* +{} 重複匹配
3 ^$ 邊界限制
4 | 模式選擇
POSIXRegex函數
ereg()和eregi()
ereg_replace()和eregi_replace()
split()和spliti()
ereg()和eregi()ereg()字串匹配函數,eregi()是ereg()函數的忽略大小的版本
文法格式:if (!ereg('^[^./][^/]*$', $userfile))//不匹配格式輸出die
{
die('這是一個非法的檔案名稱!');
}
ereg_replace()和eregi_replace(忽略大小寫)替換
string eregi_replace (“Regex”,“目標替換字元”,“替換目標”)
文法格式:$string = "This is a test";
echo str_replace(" is", " was", $string);
echo ereg_replace("( )is", "\\1was", $string);\\1 為繼承第一個整體
echo ereg_replace("(( )is)", "\\2was", $string);\\2繼承第二個整體
split()和spliti(忽略大小寫)用Regex將字串分割到數組中
list:給數組中的值賦予一些變數
文法格式:$date = "04/30/1973";
list($month, $day, $year) = split ('[/.-]', $date);//列出三個變數對應格式//以什麼形式拆分 拆分誰
echo "Month: $month; Day: $day; Year: $year<br />\n";
輸出結果Month: 04; Day: 30; Year: 1973