PHP中的遞迴Regex用法

來源:互聯網
上載者:User

例子如下.

假設你的文本中包含了正確配對的嵌套括弧. 括弧的深度可以是無限層. 你想捕獲這樣的括弧組.

恕我劇透, 標準答案是這樣的:

 代碼如下 複製代碼

<?php
$string = "some text (a(b(c)d)e) more text";
if(preg_match("/(([^()]+|(?R))*)/",$string,$matches))
{
    echo "<pre>"; print_r($matches); echo "</pre>";
}
?>
其輸出結果是:


 Array
(
    [0] => (a(b(c)d)e)
    [1] => e   
)

可見, 我們所需要的文本, 已經捕獲到$matches[0]中了.

原理
現在思考原理.

上面的Regex中的關鍵點是(?R). (?R)的作用就是遞迴地替換它所在的整條Regex. 在每次迭代時, PHP 文法分析器都會將(?R)替換為”(([^()]+|(?R))*)“.

因此, 具體到上述的例子, 其Regex等價於:

 代碼如下 複製代碼

"/(([^()]+|(([^()]+|(([^()]+)*))*))*)/"

但是上面的代碼只適合深度為3層的括弧. 對於未知深度的括弧嵌套, 就只好使用這種正則了:

 代碼如下 複製代碼

"/(([^()]+|(?R))*)/"

它不但能夠匹配無限深度, 還簡化了Regex的文法. 功能強大, 文法簡潔.

現在來細看一下"/(([^()]+|(?R))*)/"是怎樣匹配"(a(b(c)d)e)"的:

1."(c)"這部分被正則式 "(([^()]+)*)" 匹配. 請注意, (c) 其實就相當於整個遞迴的一個縮影, 麻雀雖小五髒俱全, 因此它用到了整個Regex.
換言之, 下一步中的(c), 可以使用(?R) 來匹配.
2.(b(c)d)的匹配過程為:
1."("匹配"(";
2."[^()]+"匹配"b";
3. (?R)匹配"(c)";
4."[^()]+"匹配"d";
5.")"匹配")".
根據上面的匹配原理, 不難理解為什麼數組的第2個元素$matches[1]與'e'等價. 子串'e'是在最後一次匹配迭代中被捕獲. 匹配過程中, 只有最後一次的捕獲結果才會儲存到數組中.

rex注: 關於這個特性, 可以自行嘗試一下, 看看使用正則式([a-z]+[0-9]+)+來匹配字串abc123xyz890, 其捕獲結果$1是什麼. 注意, 其結果與 Left Longest 原理並不衝突.

如果我們只需要捕獲 $matches[0], 可以這樣做:

 代碼如下 複製代碼

 <?php
    $string = "some text (a(b(c)d)e) more text";
    if(preg_match("/((?:[^()]+|(?R))*)/",$string,$matches))
    {
        echo "<pre>"; print_r($matches); echo "</pre>";
    }
?>
產生的結果相同:


 Array
    (
     [0] => (a(b(c)d)e)
    )

所做的改動是捕獲括弧()改為非捕獲捕獲括弧(?:)了.

還可以進一步完善為:

 代碼如下 複製代碼
 <?php
    $string = "some text (a(b(c)d)e) more text";
    if(preg_match("/((?>[^()]+|(?R))*)/",$string,$matches))
    {
        echo "<pre>"; print_r($matches); echo "</pre>";
    }
?>

這裡我們用到了所謂的一次性模式(rex注: 餘晟先生譯的《精通Regexv3.0》中, 謂之”固化分組”. 可參考該書.) PHP手冊也推薦只要條件允許, 就儘可能使用這種模式, 以便提升Regex的速度.

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.