Linux之grep及Regex,grepRegex
grep簡介
grep 是一種強大的文本搜尋工具,它能使用Regex搜尋文本,並把匹配的行列印出來。通常grep有三種版本grep、egrep(等同於grep -E)和fgrep。egrep為擴充的grep,fgrep則為快速grep(固定的字串來對文本進行搜尋,不支援Regex的引用但是查詢極為快速)。grep是Linux文本處理三劍客之一。
grep使用方式
使用方式:grep [OPTIONS] PATTERN [FILE...]
grep [OPTIONS] [-e PATTERN | -f FILE] [FILE...]
常用選項:
--color=auto:對匹配到的文本著色後進行高亮顯示;
-i:忽略字元的大小寫
-o:僅顯示匹配到的字串
-v:顯示不能被模式比對到的行
-E:支援使用擴充的Regex
-q:靜默模式,即不輸出任何資訊
-A #:顯示被模式比對的行及其後#行
-B #:顯示被模式比對的行及其前#行
-C #:顯示被模式比對的行及其前後各#行
注:使用grep匹配時需使用雙引號引起來(單引號為強引用),防止被系統誤認為參數或者特殊命令而報錯。擴充grep使用方式
使用方式:egrep [OPTIONS] PATTERN [FILE...]
grep -E [OPTIONS] PATTERN [FILE...]
-i:忽略字元的大小寫
-o:僅顯示匹配到的字串本身
-v:顯示不被模式比對到的行
-q:靜默模式,即不輸出任何資訊
-A #:顯示被模式比對的行及其後#行
-B #:顯示被模式比對的行及其前#行
-C #:顯示被模式比對的行及其前後各#行
-G:支援基本Regex
grepRegex元字元
‘^‘: 錨定行首
‘$’: 錨定行尾
‘.‘: 匹配任一一個字元
‘*’: 匹配零個或多個先前字元
‘\?‘:匹配其前面的字元0次或者1次;
‘\+’:匹配其前面的字元1次或者多次;
‘\{m\}‘:匹配其前面的字元m次(\為逸出字元)
‘\{m,n\}’:匹配其前面的字元至少m次,至多n次
‘[]‘: 匹配一個指定範圍內的字元 | ‘[^]’匹配指定範圍外的任意單個字元
‘\<‘或‘\b’:錨定詞首,‘\>’或‘\b’:錨定詞尾(可用\<PATTERN\>:匹配完整單詞)
‘\(\)’:將多個字元當做一個整體進行處理
後向引用:引用前面的分組括弧中的模式所匹配到的字元
分組括弧中的模式比對到的內容或被Regex引擎自動記錄於內部的變數中:
\1:模式從左側起,第一個左括弧及與之匹配的右括弧之間模式比對到的內容
\2:模式從左側起,第二個左括弧及與之匹配的右括弧之間模式比對到的內容...
擴充Regex與Regex略有不同:
'[]':依舊匹配指定範圍內的任意單個字元;但是有很多特殊匹配方式。
[:digit:] 匹配任意單個數字
[:lower:] 匹配任意單個小寫字母
[:upper:] 匹配任意單個大寫字母
[:alpha:] 匹配任意單個字母
[:alnum:] 匹配任意單個字母或數字
[:punct:] 匹配任意單個符號
[:space:] 匹配單個空格
一些地方取消了逸出字元的使用:
‘?‘:匹配其前面的字元0次或者1次;
‘+’:匹配其前面的字元1次或者多次;
‘{m}‘:匹配其前面的字元m次(\為逸出字元)
‘{m,n}’:匹配其前面的字元至少m次,至多n次
():將一個或多個字元捆綁在一起,當做一個整體進行處理,反向引用照常使用。
‘|’:或(注:‘C|cat’為C與cat,‘(C|c)at才是Cat與cat’)
練習題:
1、列出當前系統上所有已經登入的使用者的使用者名稱,注意:同一個使用者登入多次,則只顯示一次
[root@localhost ~]# who | cut -d' ' -f1|uniqroot
2、取出最後登入到當前系統的使用者的相關資訊
[root@localhost ~]# id `last | head -1 | cut -d' ' -f1`uid=0(root) gid=0(root) groups=0(root)
3.取出當前系統上被使用者當做其預設shell最多的那個shell
[root@localhost ~]# cut -d':' -f7 /etc/passwd|uniq -c|sort -n|tail -1|cut -d' ' -f7/sbin/nologin
4.將/etc/passd中的第三個欄位設定最大的後10個使用者的資訊全部改為大寫儲存至/tmp/maxuser.txt檔案中
[root@localhost ~]# sort -t':' -k3 -n /etc/passwd|tail -10|tr 'a-z' 'A-Z' >/tmp/maxusers.txt[root@localhost ~]# cat /tmp/maxusers.txt NOBODY:X:99:99:NOBODY:/:/SBIN/NOLOGINSYSTEMD-NETWORK:X:192:192:SYSTEMD NETWORK MANAGEMENT:/:/SBIN/NOLOGINNGINX:X:996:994:NGINX WEB SERVER:/VAR/LIB/NGINX:/SBIN/NOLOGINCHRONY:X:997:995::/VAR/LIB/CHRONY:/SBIN/NOLOGINPOLKITD:X:998:996:USER FOR POLKITD:/:/SBIN/NOLOGINSYSTEMD-BUS-PROXY:X:999:997:SYSTEMD BUS PROXY:/:/SBIN/NOLOGINDINGJIE:X:1000:1000:DINGJIE:/HOME/DINGJIE:/BIN/BASHJEFF:X:1001:1024:WOSHIDASHUAIBI:/HOME/JEFF:/BIN/BASHEGON:X:1002:1002::/HOME/EGON:/BIN/BASHNFSNOBODY:X:65534:65534:ANONYMOUS NFS USER:/VAR/LIB/NFS:/SBIN/NOLOGIN
5.取出當前主機的IP地址
[root@localhost ~]# ifconfig | egrep "inet.*broadcast.*"|cut -d' ' -f10192.168.0.133
6.列出/etc目錄下所有已.conf結尾的檔案的檔案名稱,並將其名字轉換為大寫後儲存至/tmp/etc.conf檔案中
[root@localhost ~]# find /etc -name '*.conf' | egrep -o "[^/]*(\.conf)$"|tr 'a-z' 'A-Z' >/tmp/etc.conf[root@localhost ~]# cat /tmp/etc.conf RESOLV.CONFCA-LEGACY.CONFFASTESTMIRROR.CONFLANGPACKS.CONFSYSTEMD.CONFVERSION-GROUPS.CONFLVM.CONFLVMLOCAL.CONFASOUND.CONFLDAP.CONFMLX4.CONFRDMA.CONFSMTPD.CONF
7.顯示/var目錄下一級子目錄或檔案的總數
[root@localhost ~]# ls /var | wc -l21
8.取出/etc/group第三個欄位數值最小的10個組的名字
[root@localhost ~]# sort -t: -k3 -n /etc/group|head -10 |cut -d':' -f1rootbindaemonsysadmttydisklpmemkmem
9.將/etc/fstab和/etc/issue檔案的內容合并為同一個內容後儲存至/tmp/etc.test檔案中
[root@localhost ~]# cat /etc/fstab /etc/issue > /tmp/etc.test[root@localhost ~]# cat /tmp/etc.test ## /etc/fstab# Created by anaconda on Sat May 13 10:12:58 2017## Accessible filesystems, by reference, are maintained under '/dev/disk'# See man pages fstab(5), findfs(8), mount(8) and/or blkid(8) for more info#/dev/mapper/cl-root / xfs defaults 0 0UUID=2789d01a-4e2b-47a5-9c3c-537641648663 /boot xfs defaults 0 0/dev/mapper/cl-swap swap swap defaults 0 0\SKernel \r on an \m
對於Regex的使用需要多聯絡加強記憶,否則是用不好Regex的,在學習過程中切記多寫多背。