關於php中正則匹配包括分行符號在內的任一字元的問題總結

來源:互聯網
上載者:User

標籤:style   blog   http   color   使用   os   

要使用正則匹配任一字元的話,通常有以下幾種方法,這裡我分別對每一種方法在使用的過程中做一個總結:

第一種方式:[.\n]*?
樣本

?View Code PHP
preg_match_all(‘/<div class="list">[.\n]*?<\/div>/i‘, $content, $data);

按道理這種方式應該是可以的,但我測試發現不行,因為這裡中括弧裡面的“.”被當作一個普通的英文句號去處理了,而不是萬用字元,因此這裡只能匹配到包含英語句號及分行符號在內的任意內容了。

第二種方式:.*?
樣本

?View Code PHP
preg_match_all(‘/<div class="list">.*?<\/div>/is‘, $content, $data);

這種方式是沒問題的,但要記得後面加的/s修正符。

第三種方式:(.|\n)*?
樣本

?View Code PHP
preg_match_all(‘/<div class="list">(?:.|\n)*?<\/div>/i‘, $content, $data);

與第一種方式相比,這裡的“.”不會被當作一般字元處理,而是真正期望的萬用字元了,如此說來這種方式也沒問題,但我在測試中發現,當要匹配的字串 內容有點長的時候就不行了,再更換至高版本的php環境下去測試則正常,由此得出這應該跟php所綁定的PCRE庫版本有關了。

第四種方式:[\s\S]*?
樣本

?View Code PHP
preg_match_all(‘/<div class="list">[\s\S]*?<\/div>/i‘, $content, $data);

這種方式完全沒問題,我在windows及linux環境下測試都通過,在各個常見的php版本下測試也通過。

最後還有一點需要注意的是,linux環境下是有\n(分行符號)而沒有\r(斷行符號符)的,而windows環境下通常是\r\n(斷行符號換行)連在一起的,測試匹配時得留意這個細節差異。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.