python中的Regex

來源:互聯網
上載者:User

標籤:

python的Regex在http://www.cnblogs.com/huxi/archive/2010/07/04/1771073.html中講解的比較詳細。

本文需要補充以下幾個問題:

1、pythonRegex中的貪婪與非貪婪:

pythonRegex預設是貪婪的,也就是說儘可能多的匹配。如果想讓Regex變為不貪婪,可加限定符?。

*?、+?、??、和{m,n}?,這樣就儘可能小的匹配了。

2、Regex中的環視結構:

環視結構不匹配任何字元,只匹配文本中的特定位置。

類型 Regex 匹配成功的條件
肯定逆序環視 (?<=...) 子運算式能夠匹配左側文本
否定逆序環視 (?<!...) 子運算式不能匹配左側文本
肯定順序環視 (?=...) 子運算式能夠匹配右側文本
否定順序環視 (?!...) 子運算式不能匹配右側文本

3、解決匹配不以"abc"中任何一個字母開頭的單詞問題:

需要用到環視,從單詞的開始位置開始匹配,可以用\b匹配單詞的開始位置。不以"abc"中任何一個字母開頭,也就是說單詞的開始位置的右邊不是‘a‘,‘b‘,‘c‘,最終Regex為:\b(?![abc])\w+

4、Regex模式:

模式     描述

^        匹配字串的開頭

$        匹配字串的末尾。

.        匹配任一字元,除了分行符號,當re.DOTALL標記被指定時,則可以匹配包括分行符號的任一字元。

[...]        用來表示一組字元,單獨列出:[amk] 匹配 ‘a‘,‘m‘或‘k‘

[^...]        不在[]中的字元:[^abc] 匹配除了a,b,c之外的字元。

re*        匹配0個或多個的運算式。

re+         匹配1個或多個的運算式。

re?        匹配0個或1個由前面的Regex定義的片段,貪婪方式

re{ n}

re{ n,} 精確匹配n個前面運算式。

re{ n, m}  匹配 n 到 m 次由前面的Regex定義的片段,貪婪方式

a| b           匹配a或b

(re)G         匹配括弧內的運算式,也表示一個組

(?imx) Regex包含三種可選標誌:i, m, 或 x 。隻影響括弧中的地區。

(?-imx) Regex關閉 i, m, 或 x 可選標誌。隻影響括弧中的地區。

(?: re) 類似 (...), 但是不表示一個組

(?imx: re)       在 括弧中使用i, m, 或 x 可選標誌

(?-imx: re)  在括弧中不使用i, m, 或 x 可選標誌

(?#...)         注釋.

(?= re)        前向肯定界定符。如果所含Regex,以 ... 表示,在當前位置成功匹配時成功,否則失敗。但一旦所含運算式已經嘗試,匹配引擎根本沒有提高;模式的剩餘部分還要嘗試界定符的右邊。

(?! re)       前向否定界定符。與肯定界定符相反;當所含運算式不能在字串當前位置匹配時成功

(?> re)       匹配的獨立模式,省去回溯。

\w              匹配字母數字

\W              匹配非字母數字

\s             匹配任意空白字元,等價於 [\t\n\r\f].

\S             匹配任意非Null 字元

\d             匹配任一數字,等價於 [0-9].

\D                匹配任意非數字

\A            匹配字串開始

\Z           匹配字串結束,如果是存在換行,只匹配到換行前的結束字串。c

\z           匹配字串結束

\G            匹配最後匹配完成的位置。

\b             匹配一個單詞邊界,也就是指單詞和空格間的位置。例如, ‘er\b‘ 可以匹配"never" 中的 ‘er‘,但不能匹配 "verb" 中的 ‘er‘。

\B             匹配非單詞邊界。‘er\B‘ 能匹配 "verb" 中的 ‘er‘,但不能匹配 "never" 中的 ‘er‘。

\n, \t, 等.     匹配一個分行符號。匹配一個定位字元。等

\1...\9     比賽第n個分組的子運算式。

\10            匹配第n個分組的子運算式,如果它經匹配。否則指的是八進位字元碼的運算式。


python中的Regex

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.