phpRegex中的函數我們之前為大家結果一個preg_match函數,相信大夥對此有所瞭解,那麼phpRegex中preg_match_all函數的具體使用是如何的呢?今天我們就帶大家瞭解phpRegex中preg_match_all函數的詳解!
瞭解Regex之前,須要掌握一些常用的Regex的基礎知識,這些如果能記得最好記得,記不住須要用的時候能查到就行,就多個特殊字元,所以說Regex玩的就是特殊,具體大家可以查看更加細緻的說明。
preg_match_all函數具體說明大家可以查看PHP手冊,本文運用 preg_match_all用於測試正則表達的效果。
執行個體代碼:
$html = '<p id="biuuu">jb51.net</p><p id="biuuu_2">jb51.net2</p><p id="biuuu_3">jb51.net3</p>';
執行個體要求:分別將每一個p元素的ID和內容取出,如biuuu,biuuu_2,biuuu_3,jb51.net,jb51.net2和jb51.net3(一些常用的抓站要領就是這樣匹配的)
分析:
字串是一個基本的HTML元素,每一個p元素對應該一個ID和內容,並且是獨立的,首先考慮如何 取出一個p內的ID值和內容,如:jb51.net,然後匹配其它類似的元素。一個p中須要取出兩個值,也就是兩個匹配的運算式,第一個運算式用於匹配ID值(biuuu),第二個運算式用於匹配ID的內容(jb51.net),Regex常用的運算式運用小括弧,那麼前面的元素將會變成如下形式:
<p id="(biuuu)">(jb51.net)</p> <p id="(運算式1)">(運算式2)</p>
好,運用如上小括弧把須要匹配的地區執行 了劃分,接下來就是如何 匹配各個運算式內的內容,我們猜想一個ID可能是字母,數字或底線,那這就變得基本了,運用中括弧就可以實現,如下:
運算式1:
[a-zA-Z0-9_]+ (表示匹配大小寫字母,數字和底線)
那如何 匹配運算式2,因為ID的內容可以是任意的字元,但是要留心,不能匹配<或>字元,因為如果匹配這兩個字元將會把後面運用的p都匹配出來,因此須要排除這兩個字元開始的元素,也就是不匹配以<或>字元,如下:
運算式2:
[^<>]+ (表示不匹配<和>字元)
這樣,須要匹配的子運算式就實現了,但是還要須要匹配一個 的運算式,要領如下:
運算式:/ '\"(運算式1)\"'>(運算式2)<\/p>/
留心其中的雙引號"和/須要運用 \逸出字元轉義,然後把前面兩個運算式放進去,
如下:
'\"([a-z0-9_]+)\"'>/<p id=\"([a-z0-9_]+)\">([^<>]+)<\/p>/
這樣就實現一個匹配每一個p元素ID值和內容的Regex,然後運用 preg_match_all函數測試如下:
$html = '<p id="biuuu">jb51.net</p><p id="biuuu_2">jb51.net2</p><p id="biuuu_3">jb51.net3</p>'; preg_match_all('/<p\sid=\"([a-z0-9_]+)\">([^<>]+)<\/p>/',$html,$result); var_dump($result);
結果:
array(3) { [0]=> array(3) { [0]=> string(30) "<p id="biuuu">jb51.net</p>" [1]=> string(33) "<p id="biuuu_2">jb51.net2</p>" [2]=> string(33) "<p id="biuuu_3">jb51.net3</p>" } [1]=> array(3) { [0]=> string(5) "biuuu" [1]=> string(7) "biuuu_2" [2]=> string(7) "biuuu_3" } [2]=> array(3) { [0]=> string(8) "jb51.net" [1]=> string(9) "jb51.net2" [2]=> string(9) "jb51.net3" } }
共有三個運算式,分別顯示每一個運算式匹配的值,並以數組的形式儲存,這樣就把每一個p元素的ID和內容取出。運用Regex最主要還是要知道須要什麼,然後跟椐須要執行 匹配,並且思路清晰,並適當的藉助preg_match_all函數執行 輸出調試,非常方便。
總結:
看這篇文章和上一篇文章,相信大家對phpRegex中的這兩個函數都有自己的理解和認識,對此希望對你的工作有所協助!
相關推薦:
phpRegex中preg_match函數的詳解
phpRegex驗證郵箱地址的案例
phpRegex的執行個體分析
phpRegex入門詳解