我在寫小偷中用了大量的正則,所以在接下來的版本中要逐步減少正則的應用
在PHPRegex中需要轉義的字元如下:
$^*()+={}[]|/:<>.?'"
注意:perl風格中運算式要求以/開始和結尾,如:/food/ 表匹配字元 food
perl修飾符如下:
i 完成不區分大小寫搜尋
g 尋找所有出現(all occurrences,完成全域搜尋)
m 將一個字串視為多行(m就表示多(multiple))。預設情況下,^和$字元匹配字串中的最開始和最末尾。使用m修飾符將使^和$匹配字串中每行的開始
s 將一個字串視為一行,忽略其中的所有分行符號;它與m修飾符正好相反
x 忽略Regex中的空白和注釋
U 第一次匹配後停止。預設情況下,將找到最後一個匹配字元結果。利用這個修飾符可以在第一次匹配後停止。進而形式迴圈匹配。
元字元說明:
利用PerlRegex還可以做另一件有用的事情,這就是使用各種元字元來搜尋匹配。元字元(metacharacter)就是一個前面有反斜線的字母字元,表示某種特殊含義。以下是一些有用的元字元。
A 只匹配字串開頭
b 匹配單詞邊界
B 匹配單詞邊界之外的任一字元
d 匹配數字字元,它與[0-9]相同
D 匹配非數字字元
s 匹配空白字元
S 匹配非空白字元
[] 包圍一個字元類,字元類包括:[0-9] [a-z] [a-zA-Z] 等類似。
() 包圍一個字元分組或定義一個反引用
$ 匹配行尾
^ 匹配行首
* 匹配前面的子運算式零次或多次。要匹配 * 字元,請使用 *
+ 匹配前面的子運算式一次或多次。要匹配 + 字元,請使用 +
? 匹配前面的子運算式零次或一次,或指明一個非貪婪限定符 ?
. 匹配除換行之外的任何字元
引出下一個元字元
w 匹配任何只包含底線和字母數字字元的字串,它與 [a-zA-Z0-9_]相同
W 匹配沒有底線和字母數字字元的字串
Perl風格函數有:
array preg_grep(string pattern, array input [, flags])
搜尋數組中所有元素,返回由與某個模式比對的所有元素組成的數組
PHP 4.3增加了一個選擇性參數 flag,它接受一個值 PREG_GREP_INVERT 傳遞此標誌將得到與該模式不匹配的資料元素。
int preg_match(string pattern, string string [, array matches [, int flags [, int offset]]])
在字串中搜尋模式,如果存在返回TRUE,否則返回FALSE。
可選輸入參數matches可以包含搜尋模式中包含的子模式的各個部分。預設返回 匹配的字串,當有()子包圍時,會在數組後面輸出。
int preg_match_all(string pattern, string string, array pattern_array [, int order])
和函數 preg_match一樣,不過 preg_match 只搜尋一次,而 preg_match_all 會執行迴圈搜尋,返回所有匹配的結果。
mixed preg_replace(mixed pattern, mixed replacement, mixed str [, int limit])
用replacement替換pattern的所有出現,並返回修改後的結果。
可選 limit 指定應當發生多少次匹配。不設定limit或設定為-1將替換所有出現的情況。
以上為常用函數,還有 preg_quote, preg_replace_callbak, preg_split等詳細解釋略。。。