PHP正則 貪婪模式與懶惰模式
貪婪模式
當Regex中包含能接受重複的限定符時,通常的行為是(在使整個運算式能得到匹配的前提下)匹配儘可能多的字元。
考慮這個運算式:a.*b,它將會匹配最長的以a開始,以b結束的字串。如果用它來搜尋aabab的話,它會匹配整個字串aabab。這被稱為貪婪匹配。
懶惰模式
有時,我們更需要懶惰匹配,也就是匹配儘可能少的字元。前面給出的限定符都可以被轉化為懶惰匹配模式,只要在它後面加上一個問號?。這樣.*?就意味著匹配任意數量的重複,但是在能使整個匹配成功的前提下使用最少的重複。現在看看懶惰版的例子吧:
a.*?b匹配最短的,以a開始,以b結束的字串。如果把它應用於aabab的話,它會匹配aab(第一到第三個字元)和ab(第四到第五個字元)。
例子2
要求字串: src="http://www.bloghome.cn/1.mp3" type="application/x-mplayer2" 中找到匹配結果:http://www.bloghome.cn/1.mp3
如果匹配運算式寫為:
/src="(.*)"/,
$str ='src="http://www.bloghome.cn/1.mp3" type="application/x-mplayer2"'; preg_match('/src="(.*)"/', $str, $matches);
得到$matches[1]結果為
http://www.bloghome.cn/1.mp3" type="application/x-mplayer2因為最後一個雙引號的匹配是貪婪模式的。
如果匹配運算式寫為:
/src="(.*?)"/,得到$matches[1]結果為
http://www.bloghome.cn/1.mp3
結尾定界符/後面的含義
注意, 若pattern中使用了
引用
/i 表示不區分大小寫
/s 表示.還匹配空白字元
/U 表示模式反轉, 即貪婪匹配模式變成懶惰匹配模式, 懶惰匹配模式變成貪婪匹配模式