Python庫詳解之Regex

來源:互聯網
上載者:User

昨天的解析網頁(http://blog.csdn.net/xiadasong007/archive/2009/09/05/4521844.aspx)實在是件很鬱悶的事,在我看來,如果想真正完全解析任意的網頁,前提必須是能非常熟練的解析字串。因此,繼上篇,我不是繼續探究Python庫中其他網路編程,而是來揭開Regex的神秘面紗,請這位高手幫忙處理各種檔案。

 

Regex基本知識:

 

1:請注意如下符號(這些符號被稱為“元字元”):. ^ $ * + ? { [ ] / | ( )】

 

 . 匹配除了換行字元以外的任一字元

^ 取反的作用,如^5表示除5之外的字元

[ ] 要匹配的字元集,如[abc]就是要匹配'a','b','c'中的任意一個;而[a-z]是匹配'a'-'z'的字元

/    後面加不同的字元表示不同的意思

$  匹配行尾

 

* 指定前一個字元可以被匹配零次或更多次,如ab*c表示匹配ac,abc,abbc,...

+ 表示匹配一或更多次,如ab+c表示匹配abc,abbc,abbbc,...

?  匹配一次或零次,如ab?c表示匹配ac,abc

{m,n}  重複在m到n間,如ab{1,3}c表示匹配abc,abbc,abbbc

 |  

( )

 

 

 

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.