[轉] vim Regex 很強大

來源:互聯網
上載者:User

標籤:

毋庸多言,在vim中Regex得到了十分廣泛的應用。 最常用的 / 和 :s 命令中,Regex都是不可或缺的。 下面對vim中的Regex的一些痛點進行說明。

關於magic

vim中有個magic的設定。設定方法為:

:set magic " 設定magic :set nomagic " 取消magic :h magic " 查看協助

vim畢竟是個編輯器,Regex中包含的大量元字元如果原封不動地引用(像perl 那樣), 勢必會給不懂Regex的人造成麻煩,比如 /foo(1) 命令, 大多數人都用它來尋找foo(1)這個字串, 但如果按照Regex來解釋,被尋找的對象就成了 foo1 了。

於是,vim就規定,Regex的元字元必須用反斜線進行轉義才行, 如上面的例子,如果確實要用Regex,就應當寫成 /foo\(1\) 。 但是,像 . * 這種極其常用的元字元,都加上反斜線就太麻煩了。 而且,眾口難調,有些人喜歡用Regex,有些人不喜歡用……

為瞭解決這個問題,vim設定了 magic 這個東西。簡單地說, magic就是設定哪些元字元要加反斜線哪些不用加的。 簡單來說:

magic (\m):除了 $ . * ^ 之外其他元字元都要加反斜線。nomagic (\M):除了 $ ^ 之外其他元字元都要加反斜線。

這個設定也可以在Regex中通過 \m \M 開關臨時切換。 \m 後面的Regex會按照 magic 處理,\M 後面的Regex按照 nomagic 處理, 而忽略實際的magic設定。

例如:

/\m.* # 尋找任一字元串 /\M.* # 尋找字串 .* (點號後面跟個星號)

另外還有更強大的 \v 和 \V。

\v (即 very magic 之意):任何元字元都不用加反斜線\V (即 very nomagic 之意):任何元字元都必須加反斜線

例如:

/\v(a.c){3}$ # 尋找行尾的abcaccadc /\m(a.c){3}$ # 尋找行尾的(abc){3} /\M(a.c){3}$ # 尋找行尾的(a.c){3} /\V(a.c){3}$ # 尋找任意位置的(a.c){3}$

預設設定是 magic,vim也推薦大家都使用magic的設定,在有特殊需要時,直接通過 \v\m\M\V 即可。

本文下面使用的元字元都是 magic 模式下的。

量詞

vim的量詞與perl相比一點也不遜色。

vim Perl 意義
* * 0個或多個(匹配優先)
\+ + 1個或多個(匹配優先)
\? 或 \= ? 0個或1個(匹配優先),\?不能在 ? 命令(逆向尋找)中使用
\{n,m} {n,m} n個到m個(匹配優先)
\{n,} {n,} 最少n個(匹配優先)
\{,m} {,m} 最多m個(匹配優先)
\{n} {n} 恰好n個
\{-n,m} {n,m}? n個到m個(忽略優先)
\{-} *? 0個或多個(忽略優先)
\{-1,} +? 1個或多個(忽略優先)
\{-,1} ?? 0個或1個(忽略優先)

從上表中可見,vim的忽略優先量詞不像perl的 *? +? ?? 那樣,而是統一使用 \{- 實現的。 這大概跟忽略優先量詞不常用有關吧。

環視和固化分組

vim居然還支援環視和固化分組的功能,強大,贊一個  關於環視的解釋請參考Yurii的《精通Regex》 一書吧。

vim Perl 意義
\@= (?= 順序環視
\@! (?! 順序否定環視
\@<= (?<= 逆序環視
\@<! (?<! 逆序否定環視
\@> (?> 固化分組
\%(atom\) (?: 非捕獲型括弧

和perl稍有不同的是,vim中的環視和固化分組的模式的位置與perl不同。 例如,尋找緊跟在 foo 之後的 bar,perl將模式寫在環視的括弧內, 而vim將模式寫在環視的元字元之前。

# Perl的寫法 /(?<=foo)bar/ # vim的寫法 /\(foo\)\@<=barvimRegex 寫道

元字元 說明
. 匹配任意一個字元
[abc] 匹配方括弧中的任意一個字元。可以使用-表示字元範圍,
如[a-z0-9]匹配小寫字母和阿拉伯數字。
[^abc] 在方括弧內開頭使用^符號,表示匹配除方括弧中字元之外的任一字元。
\d 匹配阿拉伯數字,等同於[0-9]。
\D 匹配阿拉伯數字之外的任一字元,等同於[^0-9]。
\x 匹配十六進位數字,等同於[0-9A-Fa-f]。
\X 匹配十六進位數字,等同於[^0-9A-Fa-f]。
\w 匹配單詞字母,等同於[0-9A-Za-z_]。
\W 匹配單詞字母之外的任一字元,等同於[^0-9A-Za-z_]。
\t 匹配<TAB>字元。
\s 匹配空白字元,等同於[ \t]。
\S 匹配非空白字元,等同於[^ \t]。
\a 所有的字母字元. 等同於[a-zA-Z]
\l 小寫字母 [a-z]
\L 非小寫字母 [^a-z]
\u 大寫字母 [A-Z]
\U 非大寫字母 [^A-Z]

表示數量的元字元
元字元 說明
* 匹配0-任意個
\+ 匹配1-任意個
\? 匹配0-1個
\{n,m} 匹配n-m個
\{n} 匹配n個
\{n,} 匹配n-任意個
\{,m} 匹配0-m個
\_. 匹配包含換行在內的所有字元
\{-} 表示前一個字元可出現零次或多次,但在整個Regex可以匹配成功的前提下,匹配的字元數越少越好
\= 匹配一個可有可無的項
\_s 匹配空格或斷行
\_[]

元字元 說明
\* 匹配 * 字元。
\. 匹配 . 字元。
\/ 匹配 / 字元。
\\ 匹配 \ 字元。
\[ 匹配 [ 字元。

表示位置的符號
元字元 說明
$ 匹配行尾
^ 匹配行首
\< 匹配單詞詞首
\> 匹配單詞詞尾

替換變數
在正規運算式中使用 \( 和 \) 符號括起正規運算式,即可在後面使用\1、\2等變數來訪問 \( 和 \) 中的內容。

懶惰模式
\{-n,m} 與\{n,m}一樣,儘可能少次數地重複
\{-} 匹配它前面的項一次或0次, 儘可能地少
\| "或"操作符
\& 並列


函數式
:s/替換字串/\=函數式
在函數式中可以使用 submatch(1)、submatch(2) 等來引用 \1、\2 等的內容,而submatch(0)可以引用匹配的整個內容。

與PerlRegex的區別 ?
元字元的區別
Vim文法 Perl文法 含義
\+ + 1-任意個
\? ? 0-1個
\{n,m} {n,m} n-m個
\(和\) (和) 分組

例如:
1,去掉所有的行尾空格:“:%s/\s\+$//”。“%”表示在整個檔案範圍內進行替換,“\s”表示空白字元(空格和定位字元),“\+”對前面的字元匹配一次或多次(越多越好),“___FCKpd___0rdquo;匹配行尾(使用“\___FCKpd___0rdquo;表示單純的“___FCKpd___0rdquo;字元);被替換的內容為空白;由於一行最多隻需替換一次,不需要特殊標誌。這個還是比較簡單的。(/<Space><Tab>)
2,去掉所有的空白行:“:%s/\(\s*\n\)\+/\r/”。這回多了“\(”、“\)”、“\n”、“\r”和 “*”。“*”代表對前面的字元(此處為“\s”)匹配零次或多次(越多越好;使用“\*”表示單純的“*”字元),“\n”代表分行符號,“\r”代表斷行符號符,“\(”和“\)”對錶達式進行分組,使其被視作一個不可分割的整體。因此,這個運算式的完整意義是,把連續的分行符號(包含分行符號前面可能有的連續空白字元)替換成為一個單個的分行符號。唯一很特殊的地方是,在模式中使用的是“\n”,而被替換的內容中卻不能使用“\n”,而只能使用“\r”。原因是曆史造成的,詳情如果有興趣的話可以查看“:help NL-used-for-Nul”。
3,去掉所有的“//”注釋:“:%s!\ s*//.*!!”。首先可以注意到,這兒分隔字元改用了“!”,原因是在模式或字串部分使用了“/”字元,不換用其他分隔字元的話就得在每次使用“/”字元本身時寫成“\/”,上面的命令得寫成“:%s/\s*\/\/.*//”,可讀性較低。命令本身倒是相當簡單,用過Regex的人估計都知道“.”匹配表示除分行符號之外的任何字元吧。
4,去掉所有的“/* */”注釋:“:%s!\s*/\*\_.\{-}\*/\s*! !g”。這個略有點複雜了,用到了幾個不太常用的 Vim Regex特性。“\_.”匹配包含換行在內的所有字元;“\{-}”表示前一個字元可出現零次或多次,但在整個Regex可以匹配成功的前提下,匹配的字元數越少越好;標誌“g”表示一行裡可以匹配和替換多次。替換的結果是個空格的目的是保證像“int/* space not necessary around comments */main()”這樣的運算式在替換之後仍然是合法的。

:g/^\s*$/d 刪除只有空白的行
:s/\(\w\+\)\s\+\(\w\+\)/\2\t\1 將 data1 data2 修改為 data2 data1
:%s/\(\w\+\), \(\w\+\)/\2 \1/ 將 Doe, John 修改為 John Doe
:%s/\<id\>/\=line(".") 將各行的 id 字串替換為行號
:%s/\(^\<\w\+\>\)/\=(line(".")-10) .".". submatch(1) 
將每行開頭的單詞替換為(行號-10).單詞的格式,如第11行的word替換成1. word
排序 :/OB/+1,$!sort

[轉] vim Regex 很強大

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.