這篇文章主要介紹了Regex之零寬斷言,簡單介紹了零寬斷言的概念、分類及php實現技巧與相關注意事項,需要的朋友可以參考下
本文執行個體講述了Regex之零寬斷言。分享給大家供大家參考,具體如下:
前言
之前我曾寫了一篇關於Regex的文章(http://www.jb51.net/article/111359.htm) 在該文章中詳細介紹了正則,但是關於零寬斷言介紹卻是很少提及到。現在將該內容補充一下。在本文中,主要解決如下問題:
① 什麼是零寬斷言,為什麼要使用零寬斷言
② 怎樣使用零寬斷言
概念
零寬斷言,大多地方這樣定義它,用於尋找在某些內容(但並不包括這些內容)之前或之後的東西,也就是說它們像 \b ^ $ \< > 這樣的錨定作用,用於指定一個位置,這個位置應該滿足一定的條件(即斷言),因此它們也被稱為零寬斷言。我的理解是在一個限定位置的字串之前或之後進行匹配尋找。所以零寬斷言,執行過程分兩種情況,如果是正向斷言,應該是這樣的,第一步,判斷判斷斷言是否為真(即是否滿足一定條件)第二步,如果滿足條件,則進行下一步尋找匹配。如果是反向斷言,第一步還是按照Regex順序去匹配。第二步,遇到反向代言,判斷是否滿足反之代言。
正先行斷言
什麼是正先行斷言,就是在字串相應位置之前進行尋找匹配,使用 (?=exp) 匹配exp前面的位置。
執行個體
$str="abcgwcab";$parent='/bc(?=gw)/';$str=preg_match($parent,$str,$match);var_dump($match);/**輸出結果:int 1array (size=1) 0 => string 'bc' (length=2) */
解析:首先尋找字串”abcgwcab”中gw位置,斷言為真,然後在匹配bc。如果將Regex寫成$parent='/bc(?=gw)ca/'; 將會匹配不成功。
反先行斷言
什麼是反先行斷言,使用 (?!exp) 匹配後面跟的不是exp。
執行個體:
$str="abcgwcab";$parent='/bc(?!ww)gw/';$str=preg_match($parent,$str,$match);var_dump($str);var_dump($match);/**輸出:int 1array (size=1) 0 => string 'bcgw' (length=4)*/
解析:首先判斷字串是否包含bc,然後判斷其後面不是ww,最後匹配gw。可以看出反向斷言之前後之後,能夠在添加其他匹配條件。
正後發斷言
什麼是正後發斷言,就是在字串相應位置之後進行尋找匹配, (?<=exp) 匹配exp後面的位置
執行個體:
$str="abcgwcab";$parent='/(?<=gw)ca/';$str=preg_match($parent,$str,$match);var_dump($str);var_dump($match);/**輸出結果:int 1array (size=1) 0 => string 'ca' (length=2)*/
解析:第一步,尋找字元”abcgwcab”中是否包含有gw,返回結果為true,然後進行第二步,尋找gw後面是否有ca。
反後發斷言
什麼是反後發斷言,使用(?
$str="abcgwcab";$parent='/(?<!bc)gw/';$str=preg_match($parent,$str,$match);var_dump($str);var_dump($match);/**int 0array (size=0) empty*/
解析:首先在字串中匹配gw,然後判斷其前面是不是bc,發現其前面是bc,故返回false。
練習題
例1:\d+(?=abc)
判斷一個字串中是否包含'abc',且其前面是否包含一個或多個數字
例2:(?<=\d\d)\w
判斷字串中是否存在連續兩個數字,且其後麵包含一個字母
例3:\d{3} (?!55)
判斷字串中是否包含連續三個數字,且三個數字後面不是55
例4:(?<!ac)\w\d
判斷一個字串是否包含一個字母加數位組合,且其前面不是ac
總結
先行斷言與後發斷言區別?
先行斷言是判斷斷言之前的Regex,斷言在其他Regex之後。後發斷言是判斷斷言之前的Regex,斷言在其他Regex之前。這裡的先與後,是其他匹配相對應斷言在Regex中的順序。