Regex匹配不包含某些字串的技巧

來源:互聯網
上載者:User
經常我們會遇到想找出不包含某個字串的文本,程式員最容易想到的是在Regex裡使用,^(hede)來過濾”hede”字串,但這種寫法是錯誤的。我們可以這樣寫:[^hede],但這樣的Regex完全是另外一個意思,它的意思是字串裡不能包含‘h',‘e',‘d'三個但字元。那什麼樣的Regex能過濾出不包含完整“hello”字串的資訊呢?

事實上,說Regex裡不支援逆向匹配並不是百分之百的正確。就像這個問題,我們就可以使用否定式尋找來類比出逆向匹配,從而解決我們的問題:

^((?!hede).)*$

上面這個運算式就能過濾出不包含‘hede'字串的資訊。我上面也說了,這種寫法並不是Regex“擅長”的用法,但它是可以這樣用的。

解釋

一個字串是由n個字元組成的。在每個字元之前和之後,都有一個Null 字元。這樣,一個由n個字元組成的字串就有n+1個Null 字元串。我們來看一下“ABhedeCD”這個字串:

所有的e編號的位置都是Null 字元。運算式(?!hede).會往前尋找,看看前面是不是沒有“hede”字串,如果沒有(是其它字元),那麼.(點號)就會匹配這些其它字元。這種Regex的“尋找”也叫做“zero-width-assertions”(零寬度斷言),因為它不會捕獲任何的字元,只是判斷。

在上面的例子裡,每個Null 字元都會檢查其前面的字串是否不是‘hede',如果不是,這.(點號)就是匹配捕捉這個字元。運算式(?!hede).只執行一次,所以,我們將這個運算式用括弧包裹成組(group),然後用*(星號)修飾——匹配0次或多次:

((?!hede).)*。

你可以理解,Regex((?!hede).)*匹配字串"ABhedeCD"的結果false,因為在e3位置,(?!hede)匹配不合格,它之前有"hede"字串,也就是包含了指定的字串。

在Regex裡, ?! 是否定式向前尋找,它幫我們解決了字串“不包含”匹配的問題。

以下是一些補充:

分享下php產生隨機數的三種方法,產生1-10之間的不重複隨機數,php產生不重複隨機數的例子,需要的朋友參考下。

在hacker news上看到regex golf,幾道很有趣的Regex的題,有的需要用到不匹配這種匹配,比如需要匹配不包含某個單詞的串。

開始正題之前,先來看看Regex的文法:

[abc] a或b或c . 任意單個字元 a? 零個或一個a
[^abc] 任意不是abc的字元 \s 空格 a* 零個或多個a
[a-z] a-z的任一字元 \S 非空格 a+ 一個或多個a
[a-zA-Z] a-z或A-Z \d 任一數字 a{n} 正好出現n次a
^ 一行開頭 \D 任意非數字 a{n,} 至少出現n次a
$ 一行末尾 \w 任意字母數字或底線 a{n,m} 出現n-m次a
(...) 括弧用於分組 \W 任意非字母數字或底線 a*? 零個或多個a(非貪婪)
(a|b) a或b \b 單詞邊界 (a)...\1 引用分組
(?=a) 前面有a (?!a) 前面沒有a \B 非單詞邊界

Regex中有(?=a)和(?!a)來表示我們是否需要匹配某個東西。

所以,有需要不匹配某樣內容時,就可以用(?!a)了。比如要匹配不含hello的字串就可以這樣寫。

^(?!.*hello)

這裡.*用來表示hello之前可能有其他的字元,為什麼還要加^呢,因為如果不加的話,可能匹配到h之後的這個位置上了。

現在就可以解決regex golf上的abba這道題了。
這道題是去匹配不含abba這種形式的單詞,比如abba,anallagmatic就不應該匹配上。

Regex代碼:

^(?!.*(.)(.)\2\1)

然後利用不匹配,還可以解決prime這道題,這道題匹配有素數個x的串,先看正則。

^(?!(xx+)\1+$)

(xx+)是匹配2個及2個以上的x,(xx+)\1+就是匹配重複出現2個及以上的串,所以(xx+)\1+就表示了那些非素數的串,那麼素數串就是除去這些非素數串,即是以上的Regex了。

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.