Linux命令中使用Regex

來源:互聯網
上載者:User

在使用grep、awk和sed命令時,需要使用Regex。
比如我通過grep找代碼編譯結果中是否有錯誤。或者是否有我代碼的錯誤。
這裡說下Regex基本的應用:

• 匹配行首與行尾。
• 匹配資料集。
• 只匹配字母和數字。
• 匹配一定範圍內的字串集。

 

^ 只匹配行首
$ 只匹配行尾
* 一個單字元後緊跟*,匹配0個或多個此單字元
[] 匹配[]內字元,可以是一個單字元,也可以是字元序列。可以使用 - 表示[]內字元序列範圍,如用[1-5]代替[12345]
\ 用來屏蔽一個元字元的特殊含義。因為有時在shell中一些元字元有特殊含義。\可以使其失去應有含義。
. 匹配任意單字元
pattern\{n\} 用來匹配前面pattern出現次數。n為次數
pattern\{n,\} 含義同上,但次數最少為n
patter\{n,m\} 含義同上,但pattern出現次數在n與m之間

 

  1. 使用句點匹配單字元
    句點“.”可以匹配任意單字元。例如,如果要匹配一個字串,以be g開頭,中間夾一個
    任一字元,那麼可以表示為be g . n,“.”可以匹配字串頭,也可以是中間任一字元。
    在ls-l命令中,可以匹配一定許可權:
    .. . x . . x . . x
    此格式匹配使用者本身,使用者組及其他群組成員的執行許可權。
    ~$ ls -l |grep ...x..x..x
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
    ~$
  2. 在行首以^匹配字串或字元序列
    ^只允許在一行的開始匹配字元或單詞。例如,使用ls-l命令,並匹配目錄。之所以可以
    這樣做是因為ls-l命令結果每行第一個字元是d,即代表一個目錄。
    ~$ ls -l |grep ^d
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 bin
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:06 emacs
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 etc
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 info
    drwxrwxrwx 1 h00209633 Domain U 0 一月 19 08:38 leim
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 09:05 lisp
    drwxrwxrwx 1 h00209633 Domain U 0 二月 7 08:07 site-lisp
  3. 在行尾以$匹配字串或字元
    可以說$與^正相反,它在行尾匹配字串或字元,$符號放在匹配單詞後。假定要匹配以
    單詞lisp結尾的所有行,操作為:
    ~$ ls |grep sp$
    lisp
    site-lisp
    ~$
  4. 使用*匹配字串中的單字元或其重複序列
    使用此特殊字元匹配任一字元或字串的重複多次運算式。例如:
    找e*m(以e開頭m結束的字串)
    ~$ ls | grep e*m
    emacs
    leim
    ~$
  5. 使用\屏蔽一個特殊字元的含義
    有時需要尋找一些字元或字串,而它們包含了系統指定為特殊字元的一個字元。什麼
    是特殊字元?一般意義上講,下列字元可以認為是特殊字元:
    $ . ' " * [ ] ^ | { } \ + ?
    例如:找以.el尾碼的檔案
    ~/lisp$ ls | grep \.el$
    abbrev.el
    abbrevlist.el
    add-log.el
    align.el
    allout.el
    ansi-color.el
    apropos.el
    arc-mode.el
    array.el
    autoarg.el
    autoinsert.el
    autorevert.el
    avoid.el
    battery.el
    bindings.el
    bookmark.el
    bs.el
    buff-menu.el
    button.el
    calculator.el
    case-table.el
  6. 使用[]匹配一個範圍或集合
    使用[]匹配特定字串或字串集,可以用逗號將括弧內要匹配的不同字串分開,但並
    不強制要求這樣做(一些系統提倡在複雜的運算式中使用逗號),這樣做可以增加模式的可讀
    性。
    使用“-”表示一個字串範圍,表明字串範圍從“-”左邊字元開始,到“-”右邊字
    符結束。
    如果熟知一個字串匹配操作,應經常使用[]模式。
    假定要匹配任意一個數字,可以使用:
    [0123456789]
    然而,通過使用“-”符號可以簡化操作:
    [0-9]
    或任意小寫字母
    [a-z]
    要匹配任意字母,則使用:
    [A-Za-z]
    表明從A-Z、a-z的字母範圍。
    如要匹配任意字母或數字,模式如下:
    [A-Za-z0-9]
    注意^符號的使用,當直接用在第一個括弧裡,意指否定或不匹配括弧裡內容。
    [^a-zA-Z]
    匹配任一非字母型字元,而
    [^0-9]
    匹配任一非數字型字元。
    通過最後一個例子,應可猜知除了使用^,還有一些方法用來搜尋任意一個特殊字元。
  7. 使用\{\}匹配模式結果出現的次數
    使用*可匹配所有匹配結果任意次,但如果只要指定次數,就應使用\{ \ },此模式有三種
    形式,即:
    pattern\{n\}匹配模式出現n次。
    pattern\{n,\}匹配模式出現最少n次。
    pattern\{n,m}匹配模式出現n到m次之間,n , m為0 - 2 5 5中任意整數。
    例如格式如下:前4個字元是數字,接下來是xx,最後4個也是數字,
    操作如下:
    [0-9]\{4\}XX[0-9]\{4\}
    具體含義如下:
    1)匹配數字出現4次。
    2)後跟代碼xx。
    3)最後是數字出現4次。
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.