使用LinuxRegex靈活搜尋檔案中的文本

使用LinuxRegex靈活搜尋檔案中的文本_Regex

最後更新：2017-01-18 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

Regex是一種符號標記法，用於識別文字模式。Linux處理Regex的主要程式是grep。grep搜尋與Regex匹配的行，並將結果輸送至標準輸出。

1. grep匹配模式

grep按下述方式接受選項和參數(其中，regex表示Regex)

複製代碼代碼如下:

grep [options] regex [files]

其中options主要為下表：

選項	含義	功能描述
-i	ignore case	忽略大小寫
-v	invert match	不匹配匹配的
-l	file-with-match	輸出匹配的檔案名稱
-L	file-without-match	輸出不匹配的檔案名稱
-c	count	輸出匹配的數目（行數）
-n	number	輸出匹配行的同時在前面加上檔案名稱及在檔案名稱中的行數
-h	no-filename	抑制檔案名稱的輸出

作為一個Linux管理員，您需要對文字檔進行處理。您可以使用不同的工具如grep、awk以及sed去尋找包含特定文本串的檔案。這裡，我將介紹一種使用Regex，以靈活的方式，去搜尋檔案中的文本的方法。

　　讓我們考慮一個Regex發揮作用的例子。比如，當你嘗試使用命令grep –r host /時，其返回的結果會很龐大。因為每一個包含host這個文本串的字(像ghostscript這樣的字)都會匹配。採用Regex，你可以更好地定製你要尋找什麼。例如，你可以使用Regex'^host'，告訴grep僅僅尋找以host開始的行。

　　Regex並不是在所有命令中都可用，您使用的命令必須已經事先編好程式，以便能夠使用Regex。這些命令中最普遍使用的命令是grep、tr以及vi。其它的工具，像sed和awk，也可以使用Regex。

　　使用Regex的一個例子為：

複製代碼代碼如下:

grep 'lin.x' *

　　Regex'lin.x'中的點有特殊的含義。它會匹配處於該位置的任一字元。為了防止解釋性的問題，我建議您總是將Regex置於單引號間，這樣就可以防止shell對Regex進行解釋。

　　使用Regex

　　您可以使用Regex做很多事情。在以下的列表中，您可以找到一些最普通、最常用的Regex的例子。

    * ^：表示文本串必須在一行的開頭。所以，當尋找行的開頭只為“hosts”的行，可以使用命令：grep -ls '^hosts'
    * $：代表了一行的結尾。所以，當尋找行的結尾只為“hosts”的行，可以使用命令：grep -ls 'hosts$'
    * 　　你可以在一個Regex中結合^和$，去尋找僅僅包含"yes"的行，使用的命令為grep -ls '^yes$'
    * .：一個可以指代除了分行符號以外任一字元的萬用字元。為了尋找包含tex、tux、tox或者tix的行，可以使用：grep -ls 't.x'
    * [ ]：表示在一個Regex中，方括弧之間的字元是可選的。為了尋找名字為pinda或者linda的使用者，可以使用命令：grep -ls '[pl]inda'
    * [^ ]：忽略掉方括弧中^之後的所有字元。為了尋找包含文本linda的行，並忽略掉其中僅包含linda或者pinda的行，命令為：grep -ls '[^pl]inda'
    * -：代表一類或者一個範圍內的字元。在像tr這樣的命令中，這是非常有用的。以下的命令可以將所有的小寫字母轉為大寫字母：tr a-z A-Z < mytext。同樣地，你可以使用Regexgrep -ls '^0-9'去尋找其中有一些行是以數字開頭的檔案。
    * \< 和 \>：尋找一個字的開頭或者結尾的模式。尋找行的開頭的字以"san"為起始的命令為： grep \<SAN< code>。這些Regex有兩個缺點—他們並不尋找以指定的Regex開頭的行，並且他們並不被所有的工具所支援。但是，vi和grep是支援這種用法的。
    * \：確保在Regex中有特殊含義的字元不被解釋。尋找以任何字元開始，後面跟著文本"host"的文本串的命令為grep -ls '.host'。而如果你需要尋找以點為第一個字元，緊接著為"host"的文本串，可以用命令：grep -ls '\.host'

　　這些Regex可以協助您找到包含特定文本串的字。您也可以使用Regex去指定,在一個字中，該字串出現的頻率。比如，您可以使用Regex去搜尋剛好包含使用者名稱"linda"三次的檔案。為了達到這一目的，您需要使用Regex的重複運算元，並保證整個Regex位於引號中。沒有引號的話，您可能會導致shell去解釋您的重複運算元。

　　最重要的重複運算元的列表如下：

    * *：表示前述的Regex可能出現一次、多次或者根本不出現。注意：不要和shell中的*混淆—在shell中，*表示任一字元，而在Regex中，*表示之前的Regex可能存在。
    * ?：表示在該位置可能是一個字元（但並不是必須是）。例如，同時尋找color和colour的命令為：grep -ls 'colo.r'
    * +：表示之前的字元或者Regex至少要出現一次
    * \{n\}：表示之前的字元或者Regex至少要出現n次。當你尋找一個介於100到999之間的數字時，這是很有用的：grep -ls '0-9\{3\}'

　　我們已經向您概述了Regex的使用方法。這可以讓您在做一個管理員時，更加地有效率。Regex可以提供更多的功能，包括一些相當複雜的操作。但在之前，請首先掌握我們已經介紹的這些技能。Regex可以非常複雜，以至於你會很容易迷失其中。

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

使用LinuxRegex靈活搜尋檔案中的文本_Regex

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support