關於Perl裡面Regex規範_基礎教程

來源:互聯網
上載者:User
1,定界符
=~ m/there/;
=~ s/there/here/;
還有類型的定界符:
=~ /there/
=~ m#there#;
=~ s#there#here#;
=~ m(there);
=~ s(there)(here);
=~ m{there};
=~ s{there}{here};
=~ m[there];
=~ s[there][here];
=~ m,there,;
=~ s,there,here,;
=~ m.there.;
=~ s.there.here.;
=~ m|there|;
=~ s|there|here|;
=~ m'there';
=~ s'there'here';
2,修改符
修改符一般放在語句最後一個正斜杠(或者其他分隔字元)的後面,修改符還可在匹配範式內定義,這是用(? 修改符)來實現的。
/x 允許在範式中加上注釋和額外的空白字元,以提高程式的可讀性。
/i 允許不分大小寫匹配範式。
/s 單行方式,決定了圓點 . 是否匹配分行符號,使用了/s,圓點就匹配分行符號,否則就不匹配。
比如:
#!/usr/bin/perl
use strict;
use warnings;
my $string = ".\n.";
print "The original string is: $string\n";
my $num = $string =~ s|(.)|#|sg;
print "$num occurences change, and be changed to: $string\n"; exit;
/m 多行方式,決定了脫字型大小 ^ 和美圓符 $ 是否匹配分行符號,如果不用/s,^和$只能定位在字串的開始和結束處,它們並不匹配嵌入的分行符號,這種情況等同於\A和\Z,否則不僅僅匹配字串的開始和結束,也匹配剛好處在嵌入分行符號前後的一個位置。
/o 僅僅一次計算運算式的值
/e 將替代字串作為一個運算式(僅僅在替代操作時有效)
/g 是一個全域修改符。另外,/g與while使用能在字串的所有匹配中進行遍曆。修改符/G必須與/g一起使用,用來匹配前一個/g匹配的停止位置。

#!/usr/bin/perl
use strict;
use warnings;
my $string = "~32sda13dAZ.'sDa#!3_C-!";
print "The original string is: $string\n";
my $num = $string =~ s.\w.#.g;
print "$num occurences change, and be changed to: $string\n";
exit;
3,正則裡一些特殊字元
() 將運算式結組
[] 尋找一組字元
\d 等於 [0-9]
\D 等於 [^0-9]
\w 等於 [0-9A-Za-z_]
\W 等於 [^0-9A-Za-z_]
\s 等於 [\f\n\r\t ]
\S 等於 [^\f\n\r\t ]
. 等於 [^\n]
4,關於一些特殊符號
\b 不屬於空白字元,向前縮排一個字元
\t 屬於空白字元,匹配製表符
\r 屬於空白字元,匹配斷行符號符
\a 不屬於空白字元,匹配鬧鐘符
\e 不屬於空白字元,匹配轉義符
\033 不屬於空白字元,匹配八進位符
\x1B 不屬於空白字元,匹配十六進位符
\c[ 不屬於空白字元,匹配控制字元
屬於空白字元,匹配空格
屬於空白字元,匹配製表符
\f 屬於空白字元,匹配換頁符
\n 屬於空白字元,匹配分行符號
\0 不屬於空白字元,功能不詳
\c 不屬於空白字元,功能不詳
\x 不屬於空白字元,功能不詳
5,注意正則裡的選擇符的特殊性
選擇運算子是所有運算子中優先順序最低的,這意味著它最後執行。
6,正則裡的限定符的一些經典用法
限定符常常與一些字元或詞聯合使用
* 匹配任意數個;
+ 匹配一個或多個;
? 匹配零個或一個;
{n} 匹配 n 個;
{n,m} 匹配 n 至 m 個;
{n,} 匹配 n 和 n 個以上;
限定符貪婪好像與生俱有的。在預設狀態下,*或+限定符匹配滿足Regex的一個範式的最大執行個體數。可用?號顯式的規定限定符的不貪婪。如果問號放在另一個限制符之後(甚至另一個問號之後),都可以使限定符不貪婪。
7,聲明與斷言
首先注意聲明的長度為 0;
Perl種有一組控制大小寫和換碼的聲明:
\u 使下一個字母變大寫;
\l 使下一個字母變小寫;
\U 使文本的剩餘字元變成大寫;
\L 使文本的剩餘字元變成小寫;
\Q 會除字母之外的其他字元進行換碼處理,直至遇到 \E 聲明、常規運算式結束或者字串結束。
\A聲明和脫字元號(^)匹配字串的開始;
\Z聲明和貨幣符號($)匹配字串的結束或剛好在字串結束前的分行符號;
\z 只匹配字串的結束;
\b 匹配一個單詞(字)邊界;
\B 匹配一個非單詞(字)邊界;
(?#text) 忽略括弧內的注釋文本;
(?:pattern) 與組一致,但匹配時不產生$1,$2;
(?imsx:pattern) 與組一致,但匹配時不產生$1,$2,在特定的風格有效期間,內嵌風格匹配修飾符;
(?=pattern) 前看聲明,如果Regex在下一次匹配 pattern 風格,就開始匹配,而且不影響匹配效果。如/\w+(?=\t)/將匹配製表符是否恰好在一個字\w+後面出現,並且定位字元不添加到$&的值中;
(?!pattern) 如果Regex在後面不匹配 pattern ,才會開始匹配。如/foo(?!bar)/,只有當出現 foo,並且後面不出現 bar 時才開始匹配;
(?<=pattern) 後看聲明,只有在pattern已經匹配下面的運算式,並且不將 pattern 的結果放入$&變數中,才匹配下面的語句。如/(?<=\t)\W+/匹配製表符是否恰好在\W+前出現,但又不將定位字元送到$&中;
(? (?[code]) 表示對 code 的使用是實驗性的。如果返回真,就認為是與(?:pattern)斷言同一行裡的匹配。code 不插入變數。這個斷言僅僅在 use re 'eval' 編譯指示符時才有效;
(?>pattern) 如果類型鎖定在當前位置,就使用單獨的 pattern 匹配子字串。如Regex/^(?>a*)ab/永遠不會匹配,因為語句(?>a*)將匹配字串開頭所有的 a 字元,並刪除與 ab 匹配的字元 a;
(!<=pattern) 非後看聲明,與後看聲明意思相反;
(!=pattern) 非前看聲明,與前看聲明意思相反;
(?(condition)yes-pattern|no-pattern) 條件運算式——條件陳述式或者是一個圓括弧中的整數,或者是一個斷言;
(?(condition)yes-pattern)
(?imsx) 嵌入風格匹配修飾符。當要把運算式修改符嵌入在變數中,然後把變數用在不指定自己的修飾符的一般規則運算式中;
(?-imsx) 這個斷言很有用——後面帶任何內容都會關閉修飾符,直到出現另一個嵌入的修飾符。
8,反向參考
Perl的Regex引擎允許使用前面匹配好的值,這些值叫做反向參考。
例如:
=~ m/(\w)\W*(\w)\W*(\w)\W*(\w)\W*\4\W*\3\W*\2\W*\1/;
=~ s/(\w)\W*(\w)\W*(\w)\W*(\w)/$4$3$2$1/;
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.