標籤:python 正則基礎
~使用Regex
- re模組提供了一個Regex引擎的介面,可以讓你將REstring編譯成對象並用他們來進行匹配。
#如果經常使用,建議編譯 compile
範例:
>>> r1=r‘^\d{3,4}-?\d{8}‘>>> re.findall(r1,‘010-12345678‘)[‘010-12345678‘]>>> p_tel=re.compile(r1) #正則編譯,變為對象,利用re模組裡的complie方法對r1編譯;>>> p_tel<_sre.SRE_Pattern object at 0x7f2e016173d0>#正則對象>>> p_tel.findall(‘01035689125‘)[‘01035689125‘]
#編譯的正則比未編譯的正則效率高
----------------------------------------------------------------------------------------------------------
-re.compile()也接受可選的標誌參數,關注re.I
-常用來實現不同的特殊功能和文法變更
範例:
>>> csvt_re=re.compile(r‘csvt‘,re.I)#在編譯過程中,添加正則屬性re.I(不區分大小寫)>>> csvt_re.findall(‘csvtCSVT‘)[‘csvt‘, ‘CSVT‘]
#注意:字串前添加‘r‘,反斜線就不會被任何特殊方式處理
----------------------------------------------------------------------------------------------------------
執行匹配:
-`RegexObject` 執行個體有一些方法和屬性,完整的列表可查閱Python Library Reference
<
| 方法/屬性 |
作用 |
| match() |
決定RE是否在字串剛開始的位置匹配 |
| search() |
掃描字串,找到這個RE匹配的位置 |
| findall() |
找到RE匹配的所有子串,並把它作為一個列表返回 |
| finditer() |
找到RE匹配的所有子串,並把它作為一個迭代器返回 |
如果沒有匹配到的話,match()和search將返回None
如果成功的話,就會返回一個`MatchObject`執行個體。
範例:
使用match
>>> csvt_re=re.compile(r‘csvt‘,re.I)>>> csvt_re.match(‘csvt hello‘)<_sre.SRE_Match object at 0x7f2e01620920>#匹配成功。返回MacthObject>>> csvt_re.match(‘ hello‘)#匹配失敗,返回空>>> csvt_re.match(‘ hello CSVT‘)#返回為空白,注意match匹配的是字串開始的位置
如果使用search
>>> csvt_re.search(‘hello CSVT‘)<_sre.SRE_Match object at 0x7f2e01620988>>>> csvt_re.search(‘hello CSvT‘)<_sre.SRE_Match object at 0x7f2e01620920>#注意此處為不區分大小寫,且是全表掃描
使用findall
>>> csvt_re.findall(‘hello CSvT hello CSvt csvt‘)[‘CSvT‘, ‘CSvt‘, ‘csvt‘]#返回為列表
使用finditer
>>> csvt_re.finditer(‘hello CSvT hello CSvt csvt‘)<callable-iterator object at 0x7f2e01634350>#返回為迭代器的對象>>> csvt_re.findall(‘csvT‘)[‘csvT‘]
match() MatchObject執行個體方法
| 方法/屬性 |
作用 |
| group() |
返回被RE匹配的字串 |
| start() |
返回匹配開始的位置 |
| end() |
返回匹配結束的位置 |
| span() |
返回一個元組包含匹配(開始,結束)的位置 |
group() :返回對象
>>> csvt_re=re.compile(r‘csvt‘,re.I)>>> x =csvt_re.match(‘CSVT,hello‘)>>> x<_sre.SRE_Match object at 0x7fa4f527f920>>>> x.group()‘CSVT‘
----------------------------------------------------------------------------------------------------------
-模組層級函數
-re模組也提供了頂級函數調用match()、search()、subn()、split()、findall()等
sub、subn :正則替換
範例:
#單純的字串替換>>> kong = ‘hello nihao‘>>> kong.replace(‘nihao‘,‘word‘)‘hello word‘#使用正則>>> rs = r‘n...o‘>>> kong = ‘hello nihao naabo nccco‘>>> re.sub(rs,‘bbb‘,kong)‘hello bbb bbb bbb‘#匹配替換所有>>> re.subn(rs,‘bbb‘,kong)(‘hello bbb bbb bbb‘, 3)#sub 和 subn 的區別 ,替換計數
split() :正則切割
#字元切割>>> ip = ‘1.2.3.4‘>>> ip.split(‘.‘)[‘1‘, ‘2‘, ‘3‘, ‘4‘]>>> s = "123+456-789*000">>> re.split(r‘[\+\-\*\/]‘,s)[‘123‘, ‘456‘, ‘789‘, ‘000‘]
#查看更多正則函數:
>>> dir(re)
#查看協助:
help(re.error)
本文出自 “思想大於技術” 部落格,謝絕轉載!
python 基礎學習 Regex2(使用)