標籤:
1.作用
Linux系統中grep命令是一種強大的文本搜尋工具,它能使用Regex搜尋文本,並把匹 配的行列印出來。grep全稱是Global Regular Expression Print,表示全域Regex版本,它的使用許可權是所有使用者。
2.格式
grep [options]
3.主要參數
[options]主要參數:
-c:只輸出匹配行的總數。
-i:不區分大 小寫(只適用於單字元)。
-l:查詢多檔案時只輸出包含匹配字元的檔案名稱。
-n:顯示匹配行及 行號。
-s:不顯示不存在或無匹配文本的錯誤資訊。
-v:顯示不包含匹配文本的所有行。
-E 使用擴充Regex
patternRegex主要參數:
\: 忽略Regex中特殊字元的原有含義。
^:匹配Regex的開始行。
$: 匹配Regex的結束行。
\<:從匹配正則表達 式的行開始。
\>:到匹配Regex的行結束。
[ ]:單個字元,如[A]即A符合要求 。
[ - ]:範圍,如[A-Z],即A、B、C一直到Z都符合要求 。
.:所有的單個字元。
* :有字元,長度可以為0。
4.grep命令使用簡單一實例
$ grep ‘test’ d*
顯示所有以d開頭的檔案中包含 test的行。
$ grep ‘test’ aa bb cc
顯示在aa,bb,cc檔案中匹配test的行。
$ grep ‘[a-z]\{5\}’ aa
顯示所有包含每個字串至少有5個連續小寫字元的字串的行。
5.預設情況下,’grep’只搜尋目前的目錄。如果 此目錄下有許多子目錄,’grep’會以如下形式列出:
grep: sound: Is a directory
這可能會使’grep’ 的輸出難於閱讀。這裡有兩種解決的辦法:
明確要求搜尋子目錄:grep -r
或忽略子目錄:grep -d skip
6.\< 和 \> 分別標註單詞的開始與結尾。
例如:
grep man * 會匹配 ‘Batman’、’manic’、’man’等,
grep ‘\<man\>’ 只匹配’man’,而不是’Batman’或’manic’等其他的字串。
grep ‘\<man’ * 匹配’manic’和’man’,但不是’Batman’,
grep ‘man\>’ * 匹配Batman,但不是’manic’
7, 使用類名
可以使用國際模式比對的類名:
[[:upper:]] [A-Z]
[[:lower:]] [a-z]
[[:digit:]] [0-9]
[[:alnum:]] [0-9a-zA-Z]
[[:space:]] 空格或tab
[[:alpha:]] [a-zA-Z]
grep ‘5[[:upper:]][[:upper:]]‘ data.doc #查詢以5開頭以兩個大寫字母結尾的行
8、舉例
1)# more size.txt size檔案的內容
b124230
b034325
a081016
m7187998
m7282064
a022021
a061048
m9324822
b103303
a013386
b044525
m8987131
B081016
M45678
B103303
BADc2345
# more size.txt | grep ‘[a-b]‘ 範圍 ;如[A-Z]即A,B,C一直到Z都符合要求
b124230
b034325
a081016
a022021
a061048
b103303
a013386
b044525
# more size.txt | grep ‘[a-b]‘*
b124230
b034325
a081016
m7187998
m7282064
a022021
a061048
m9324822
b103303
a013386
b044525
m8987131
B081016
M45678
B103303
BADc2345
# more size.txt | grep ‘b‘ 單個字元;如[A] 即A符合要求
b124230
b034325
b103303
b044525
# more size.txt | grep ‘[bB]‘
b124230
b034325
b103303
b044525
B081016
B103303
BADc2345
# grep ‘root‘ /etc/group
root::0:root
bin::2:root,bin,daemon
sys::3:root,bin,sys,adm
adm::4:root,adm,daemon
uucp::5:root,uucp
mail::6:root
tty::7:root,tty,adm
lp::8:root,lp,adm
nuucp::9:root,nuucp
daemon::12:root,daemon
# grep ‘^root‘ /etc/group 匹配Regex的開始行
root::0:root
# grep ‘uucp‘ /etc/group
uucp::5:root,uucp
nuucp::9:root,nuucp
# grep ‘\<uucp‘ /etc/group
uucp::5:root,uucp
# grep ‘root$‘ /etc/group 匹配Regex的結束行
root::0:root
mail::6:root
# more size.txt | grep -i ‘b1..*3‘ -i :忽略大小寫
b124230
b103303
B103303
# more size.txt | grep -iv ‘b1..*3‘ -v :尋找不包含匹配項的行
b034325
a081016
m7187998
m7282064
a022021
a061048
m9324822
a013386
b044525
m8987131
B081016
M45678
BADc2345
# more size.txt | grep -in ‘b1..*3‘
1:b124230
9:b103303
15:B103303
# grep ‘$‘ /etc/init.d/nfs.server | wc -l
128
# grep ‘\\$‘ /etc/init.d/nfs.server | wc –l 忽略Regex中特殊字元的原有含義,匹配$符號
(2)不匹配測試
grep ‘^[^48]‘ data.doc #不匹配行首是48的行
(3)使用擴充模式比對
grep -E ‘219|216‘ data.doc
【shell】grep命令