shell中sed用法詳解 (模式替換)

來源:互聯網
上載者:User

zz:http://doc.linuxpk.com/80440.html

sed ( stream editor ) 用法:       

       1. 是一個非互動性文字資料流編輯器。它編輯檔案或標準輸入匯出的文本拷貝。

        2. 通過行號或Regex指定要改變的文本行

       3. sed不與初始檔案打交道,而只與它的一個拷貝打交道,如果操作結果沒有重新導向到一個檔案,那麼將輸出到螢幕。       調用方式:              a. 命令列方式              b. 將sed命令插入指令檔中,然後調用sed              c. 將sed命令插入指令檔中,使得指令檔為可執行。       儲存sed輸出              重新導向到一個新檔案 >       sed中定位文本的方式              x          一行號              x,y       行號範圍              /pattern/ 查詢包含模式的行              /pattern/pattern/     查詢包含兩個模式的行              /pattern/,x              在指定行號上查詢匹配模式的行              x,/pattern/              通過行號和模式查詢匹配行              x,y!                  查詢不包含行號x,y的行       sed編輯命令              p     列印文本              匹配元字元$前,必須使用反斜線\              =  列印行號      使用-e選項              如果既列印行號又列印匹配行,必須使用兩個sed命令,並使用-e選項       附加文本              使用符號a\ ,可以指定文本一行或多行附加到指定行。若不指定文本置放位置位置,sed預設放置在每一行後面。              建立sed指令檔                     建立指令碼檔案,第一行為:                     #!/bin/sed -f       ----注 說明sed命令解釋行。指令碼在這一行尋找sed以運行命令,這裡定位在/bin              插入文本:在指定行前面插入,它也只接受一個地址。              刪除文本:d              替換命令用替換模式替換指定模式       使用sed實現的一個重要功能是在另一個系統中下載的檔案中剔除控制字元。              1. 使用s/-*//g刪除橫線-----              2. 使用/^$s/d刪除空行              3. 使用$d刪除最後一行              4. 使用1d刪除第一行              5. 使用awk{print $1}列印第一列

在這篇文章中,我們將瀏覽最常用的命令和選項,並示範它們如何工作,以及它們適於在何處使用。

替換命令

sed 工具 + 生產力以及其它任何類似的編輯器的最常用的命令之一是用一個值替換另一個值。用來實現這一目的的操作的命令部分文法是:

's/{old value}/{new value}/'

因而,下面示範了如何非常簡單地將 "tiger" 修改為 "wolf":

$ echo The tiger cubs will meet on Tuesday after school | sed
's/tiger/wolf/'
The wolf cubs will meet on Tuesday after school
$

注意如果輸入是源自之前的命令輸出,則不需要指定檔案名稱—同樣的原則也適用於 awk、sort 和其它大多數 LinuxUNIX 命令列工具 + 生產力程式。

多次修改

如果需要對同一檔案或行作多次修改,可以有三種方法來實現它。第一種是使用 "-e" 選項,它通知程式使用了多條編輯命令。例如:

$ echo The tiger cubs will meet on Tuesday after school | sed -e '
s/tiger/wolf/' -e 's/after/before/'
The wolf cubs will meet on Tuesday before school
$

這是實現它的非常複雜的方法,因此 "-e" 選項不常被大範圍使用。更好的方法是用分號來分隔命令:

$ echo The tiger cubs will meet on Tuesday after school | sed '
s/tiger/wolf/; s/after/before/'
The wolf cubs will meet on Tuesday before school
$

注 意分號必須是緊跟斜線之後的下一個字元。如果兩者之間有一個空格,操作將不能成功完成,並返回一條錯誤訊息。這兩種方法都很好,但許多管理員更喜歡另一種 方法。要注意的一個關鍵問題是,兩個撇號 (' ') 之間的全部內容都被解釋為 sed 命令。直到您輸入了第二個撇號,讀入這些命令的 shell 程式才會認為您完成了輸入。這意味著可以在多行上輸入命令—同時 Linux 將提示符從 PS1 變為一個延續提示符(通常為 ">")—直到輸入了第二個撇號。一旦輸入了第二個撇號,並且按下了 Enter 鍵,則處理就進行併產生相同的結果,如下所示:

$ echo The tiger cubs will meet on Tuesday after school | sed '
> s/tiger/wolf/
> s/after/before/'
The wolf cubs will meet on Tuesday before school
$

全域修改

讓我們開始一次看似簡單的編輯。假定在要修改的訊息中出現了多次要修改的項目。預設下,結果可能和預期的有所不同,如下所示:

$ echo The tiger cubs will meet this Tuesday at the same time
as the meeting last Tuesday | sed 's/Tuesday/Thursday/'
The tiger cubs will meet this Thursday at the same time
as the meeting last Tuesday
$

與 將出現的每個 "Tuesday" 修改為 "Thursday" 相反,sed 編輯器在找到一個要修改的項目並作了修改之後繼續處理下一行,而不讀整行。sed 命令功能大體上類似於替換命令,這意味著它們都處理?懇恍兄諧魷值牡諞桓鮁《ㄐ蛄小N 頌婊懷魷值拿懇桓魷钅浚 諭 恍兄諧魷侄喔鮃 婊壞南钅康那榭魷攏? 您必須指定在全域進行該操作:

$ echo The tiger cubs will meet this Tuesday at the same time
as the meeting last Tuesday | sed 's/Tuesday/Thursday/g'
The tiger cubs will meet this Thursday at the same time
as the meeting last Thursday
$

請記住不管您要尋找的序列是否僅包含一個字元或片語,這種對全域化的要求都是必需的。

sed 還可以用來修改記錄欄位分隔符號。例如,以下命令將把所有的 tab 修改為空白格:

sed 's// /g'

其 中,第一組斜線之間的項目是一個 tab,而第二組斜線之間的項目是一個空格。作為一條通用的規則,sed 可以用來將任意的可列印字元修改為任意其它的可列印字元。如果您想將不可列印字元修改為可列印字元—例如,鈴鐺修改為單詞 "bell"—sed 不是適於完成這項工作的工具(但 tr 是)。

有時,您不想修改在一個檔案中出現的所有指定項目。有時,您只想在滿足某些條件時才作修改—例如,在與其它一些資料匹配之後才作修改。為了說明這一點,請考慮以下文字檔:

$ cat sample_one
one 1
two 1
three 1
one 1
two 1
two 1
three 1
$

假定希望用 "2" 來替換 "1",但僅在單詞 "two" 之後才作替換,而不是每一行的所有位置。通過指定在給出替換命令之前必須存在一次匹配,可以實現這一點:

$ sed '/two/ s/1/2/' sample_one
one 1
two 2
three 1
one 1
two 2
two 2
three 1
$

現在,使其更加準確:

$ sed '
> /two/ s/1/2/
> /three/ s/1/3/' sample_one
one 1
two 2
three 3
one 1
two 2
two 2
three 3
$

請 再次記住唯一改變了的是顯示。如果您查看源檔案,您將發現它始終保持不變。您必須將輸出儲存至另一個檔案,以實現永久儲存。值得重複的是,不對源檔案作修 改實際是禍中有福—它讓您能夠對檔案進行實驗而不會造成任何實際的損害,直到讓正確命令以您預期和希望的方式進行工作。

以下命令將修改後的輸出儲存至一個新的檔案:

$ sed '
> /two/ s/1/2/
> /three/ s/1/3/' sample_one > sample_two

該輸出檔案將所有修改合并在其中,並且這些修改通常將在螢幕上顯示。現在可以用 head、cat 或任意其它類似的工具 + 生產力來進行查看。

指令檔

sed 工具允許您建立一個指令檔,其中包含從該檔案而不是在命令列進行處理的命令,並且 sed 工具通過 "-f" 選項來引用。通過建立一個指令檔,您能夠一次又一次地重複運行相同的操作,並指定比每次希望從命令列進行處理的操作詳細得多的操作。

考慮以下指令檔:

$ cat sedlist
/two/ s/1/2/
/three/ s/1/3/
$

現在可以在資料檔案上使用指令檔,獲得和我們之前看到的相同的結果:

$ sed -f sedlist sample_one
one 1
two 2
three 3
one 1
two 2
two 2
three 3
$

注意當調用 "-f" 選項時,在源檔案內或命令列中不使用撇號。指令檔,也稱為源檔案,對於想重複多次的操作和從命令列運行可能出錯的複雜命令很有價值。編輯源檔案並修改一個字元比在命令列中重新輸入一條多行的項目要容易得多。

限制行

編輯器預設查看輸入到流編輯器中的每一行,且預設在輸入到流編輯器中的每一行上進行編輯。這可以通過在發出命令之前指定約束條件來進行修改。例如,只在此樣本檔案的輸出的第 5 和第 6 行中用 "2" 來替換 "1",命令將為:

$ sed '5,6 s/1/2/' sample_one
one 1
two 1
three 1
one 1
two 2
two 2
three 1
$

在這種情況下,因為要修改的行是專門指定的,所以不需要替換命令。因此,您可以靈活地根據匹配準則(可以是行號或一種匹配模式)來選擇要修改哪些行(從根本上限制修改)。

禁止顯示

sed 預設將來自源檔案的每一行顯示到螢幕上(或重新導向到一個檔案中),而無論該行是否受到編輯操作的影響,"-n" 參數覆蓋了這一操作。"-n" 覆蓋了所有的顯示,並且不顯示任何一行,而無論它們是否被編輯操作修改。例如:

$ sed -n -f sedlist sample_one
$

$ sed -n -f sedlist sample_one > sample_two
$ cat sample_two
$

在 第一個樣本中,螢幕上不顯示任何東西。在第二個樣本中,不修改任何東西,因此不將任何東西寫到新的檔案中—它最後是空的。這不是否定了編輯的全部目的嗎? 為什麼這是有用的?它是有用的僅因為 "-n" 選項能夠被一條顯示命令 (-p) 覆蓋。為了說明這一點,假定現在像下面這樣對指令檔進行了修改:

$ cat sedlist
/two/ s/1/2/p
/three/ s/1/3/p
$

然後下面是運行它的結果:

$ sed -n -f sedlist sample_one
two 2
three 3
two 2
two 2
three 3
$

保持不變的行全部不被顯示。只有受到編輯操作影響的行被顯示了。在這種方式下,可以僅取出這些行,進行修改,然後把它們放到一個單獨的檔案中:

$ sed -n -f sedlist sample_one > sample_two
$

$ cat sample_two
two 2
three 3
two 2
two 2
three 3
$

利用它的另一種方法是只顯示一定數量的行。例如,只顯示 2-6 行,同時不做其它的編輯修改:

$ sed -n '2,6p' sample_one
two 1
three 1
one 1
two 1
two 1
$

其它所有的行被忽略,只有 2-6 行作為輸出顯示。這是一項出色的功能,其它任何工具都不能容易地實現。Head 將顯示一個檔案的頂部,而 tail 將顯示一個檔案的底部,但 sed 允許從任意位置取出想要的任意內容。

刪除行

用一個值替換另一個值遠非流編輯器可以執行的唯一功能。它還具有許多的潛在功能,在我看來第二種最常用的功能是刪除。刪除與替換的工作方式相同,只是它刪除指定的行(如果您想要刪除一個單詞而不是一行,不要考慮刪除,而應考慮用空的內容來替換它—s/cat//)。

該命令的文法是:

'{what to find} d'

從 sample_one 檔案中刪除包含 "two" 的所有行:

$ sed '/two/ d' sample_one
one 1
three 1
one 1
three 1
$

從顯示屏中刪除前三行,而不管它們的內容是什麼:

$ sed '1,3 d' sample_one
one 1
two 1
two 1
three 1
$

只顯示剩下的行,前三行不在顯示屏中出現。對於流編輯器,一般當它們涉及到全域運算式時,特別是應用於刪除操作時,有幾點要記住:

上三角號 (^) 表示一行的開始,因此,如果 "two" 是該行的頭三個字元,則

sed '/^two/ d' sample_one

將只刪除該行。
貨幣符號 ($) 代表檔案的結尾,或一行的結尾,因此,如果 "two" 是該行的最後三個字元,則

sed '/two$/ d' sample_one

將只刪除該行。

將這兩者結合在一起的結果:

sed '/^$/ d' {filename}

刪除檔案中的所有空白行。例如,以下命令將 "1" 替換為 "2",以及將 "1" 替換為 "3",並刪除檔案中所有尾隨的空行:

$ sed '/two/ s/1/2/; /three/ s/1/3/; /^$/ d' sample_one
one 1
two 1
three 1
one 1
two 2
two 2
three 1
$

其通常的用途是刪除一個標題。以下命令將刪除檔案中所有的行,從第一行直到第一個空行:

sed '1,/^$/ d' {filename}

添加和插入文本

可以結合使用 sed 和 "a" 選項將文本添加到一個檔案的末尾。實現方法如下:

$ sed '$a
> This is where we stop
> the test' sample_one
one 1
two 1
three 1
one 1
two 1
two 1
three 1
This is where we stop
the test
$

在該命令中,貨幣符號 ($) 表示文本將被添加到檔案的末尾。反斜線 () 是必需的,它表示將插入一個斷行符號符。如果它們被遺漏了,則將導致一個錯誤,顯示該命令是錯亂的;在任何要輸入斷行符號的地方您必須使用反斜線。

要將這些行添加到第 4 和第 5 個位置而不是末尾,則命令變為:

$ sed '3a
> This is where we stop
> the test' sample_one
one 1
two 1
three 1
This is where we stop
the test
one 1
two 1
two 1
three 1
$

這將文本添加到第 3 行之後。和幾乎所有的編輯器一樣,您可以選擇插入而不是添加(如果您希望這樣的話)。這兩者的區別是添加跟在指定的行之後,而插入從指定的行開始。當用插入來代替添加時,只需用 "i" 來代替 "a",如下所示:

$ sed '3i
> This is where we stop
> the test' sample_one
one 1
two 1
This is where we stop
the test
three 1
one 1
two 1
two 1
three 1
$

新的文本出現在輸出的中間位置,而處理通常在指定的操作執行以後繼續進行。

讀寫檔案

重新導向輸出的功能已經示範過了,但需要指出的是,在編輯命令運行期間可以同步地讀入和寫出檔案。例如,執行替換,並將 1-3 行寫到名稱為 sample_three 的檔案中:

$ sed '
> /two/ s/1/2/
> /three/ s/1/3/
> 1,3 w sample_three' sample_one
one 1
two 2
three 3
one 1
two 2
two 2
three 3
$

$ cat sample_three
one 1
two 2
three 3
$

由於為 w (write) 命令指定了 "1,3",所以只有指定的行被寫到了新檔案中。無論被寫的是哪些行,所有的行都在預設輸出中顯示。

修改命令

除了替換項目之外,還可以將行從一個值修改為另一個值。要記住的是,替換是對字元逐個進行,而修改功能與刪除類似,它影響整行:

$ sed '/two/ c
> We are no longer using two' sample_one
one 1
We are no longer using two
three 1
one 1
We are no longer using two
We are no longer using two
three 1
$

修 改命令與替換的工作方式很相似,但在範圍上要更大些—將一個項目完全替換為另一個項目,而無論字元內容或上下文。誇張一點講,當使用替換時,只有字元 "1" 被字元 "2" 替換,而當使用修改時,原來的整行將被修改。在兩種情況下,要尋找的匹配條件都僅為 "two"。

修改全部但……

對於大多數 sed 命令,詳細說明各種功能要進行何種修改。利用驚嘆號,可以在除指定位置之外的任何地方執行修改—與預設的操作完全相反。

例如,要刪除包含單詞 "two" 的所有行,操作為:

$ sed '/two/ d' sample_one
one 1
three 1
one 1
three 1
$

而要刪除除包含單詞 "two" 的行之外的所有行,則文法變為:

$ sed '/two/ !d' sample_one
two 1
two 1
two 1
$

如果您有一個檔案包含一系列項目,並且想對檔案中的每個項目執行一個操作,那麼首先對那些項目進行一次智能掃描並考慮將要做什麼是很重要的。為了使事情變得更簡單,您可以將 sed 與任意迭代常式(for、while、until)結合來實現這一目的。

比如說,假定您有一個名為 "animals" 的檔案,其中包含以下項目:

pig
horse
elephant
cow
dog
cat

您希望運行以下常式:

#mcd.ksh
for I in $*
do
echo Old McDonald had a $I
echo E-I, E-I-O
done

結 果將為,每一行都顯示在 "Old McDonald has a" 的末尾。雖然對於這些項目的大部分這是正確的,但對於 "elephant" 項目,它有語法錯誤,因為結果應當為 "an elephant" 而不是 "a elephant"。利用 sed,您可以在來自 shell 檔案的輸出中檢查這種語法錯誤,並通過首先建立一個命令檔案來即時地更正它們:

#sublist
/ a a/ s/ a / an /
/ a e/ s/ a / an /
/a i/ s / a / an /
/a o/ s/ a / an /
/a u/ s/ a / an /

然後執行以下過程:

$ sh mcd.ksh 'cat animals' | sed -f sublist

現 在,在運行了 mcd 指令碼之後,sed 將在輸出中搜尋單個字母 a (空格,"a",空格)之後緊跟了一個母音的任意位置。如果這種位置存在,它將把該序列修改為空白格,"an",空格。這樣就使問題更正後才顯示在螢幕上, 並確保各處的編輯人員在晚上可以更容易地入睡。結果是:

Old McDonald had a pig
E-I, E-I-O
Old McDonald had a horse
E-I, E-I-O
Old McDonald had an elephant
E-I, E-I-O
Old McDonald had a cow
E-I, E-I-O
Old McDonald had a dog
E-I, E-I-O
Old McDonald had a cat
E-I, E-I-O

提前退出

sed 預設讀取整個檔案,並只在到達末尾時才停止。不過,您可以使用退出命令提前停止處理。只能指定一條退出命令,而處理將一直持續直到滿足調用退出命令的條件。

例如,僅在檔案的前五行上執行替換,然後退出:

$ sed '
> /two/ s/1/2/
> /three/ s/1/3/
> 5q' sample_one
one 1
two 2
three 3
one 1
two 2
$

在退出命令之前的項目可以是一個行號(如上所示),或者一條尋找/匹配命令:

$ sed '
> /two/ s/1/2/
> /three/ s/1/3/
> /three/q' sample_one
one 1
two 2
three 3
$

您 還可以使用退出命令來查看超過一定標準數目的行,並增加比 head 中的功能更強的功能。例如,head 命令允許您指定您想要查看一個檔案的前多少行—預設數為 10,但可以使用從 1 到 99 的任意一個數字。如果您想查看一個檔案的前 110 行,您用 head 不能實現這一目的,但用 sed 可以:

sed 110q filename

處理問題

當使用 sed 時,要記住的重要事項是它的工作方式。它的工作方式是:讀入一行,在該行上執行它已知要執行的所有任務,然後繼續處理下一行。每一行都受給定的每一個編輯命令的影響。

如果您的操作順序沒有十分徹底地考慮清楚,那麼這可能會很麻煩。例如,假定您需要將所有的 "two" 項目修改為 "three",然後將所有的 "three" 修改為 "four":

$ sed '
> /two/ s/two/three/
> /three/ s/three/four/' sample_one
one 1
four 1
four 1
one 1
four 1
four 1
four 1
$

最初讀取的 "two" 被修改為 "three"。然後它滿足為下一次編輯建立的準則,從而變為 "four"。最終的結果不是想要的結果—現在除了 "four" 沒有別的項目了,而本來應該有 "three" 和 "four"。

當執行這種操作時,您必須非常用心地注意指定操作的方式,並按某種順序來安排它們,使得操作之間不會互相影響。例如:

$ sed '
> /three/ s/three/four/
> /two/ s/two/three/' sample_one
one 1
three 1
four 1
one 1
three 1
three 1
four 1
$

這非常有效,因為 "three" 值在 "two" 變成 "three" 之前得到修改。

標籤和注釋

可以在 sed 指令檔中放置標籤,這樣一旦檔案變得龐大,可以更容易地說明正在發生的事情。存在各種各樣與這些標籤相關的命令,它們包括:
接下來的步驟

訪問並收藏 Linux 技術中心

閱讀 Dale Dougherty 和 Arnold Robbins 的著作 sed & awk, 2nd Edition (O'Reilly & Associates 出版社)。

: 冒號表示一個標籤名稱。例如:

:HERE

以冒號開始的標籤可以由 "b" 和 "t" 命令處理。

b {label} 充當 "goto" 語句的作用,將處理髮送至前面有一個冒號的標籤。例如,

b HERE

將處理髮送給行

:HERE

如果緊跟 b 之後沒有指定任何標籤,則處理轉至指令檔的末尾。

t {label} 只要自上次輸入行或執行一次 "t" 命令以來進行了替換操作,就轉至該標籤。和 "b" 一樣,如果沒有給定標籤名,則處理轉至指令檔的末尾。

# 符號作為一行的第一個字元將使整行被當作注釋處理。注釋行與標籤不同,不能使用 b 或 t 命令來轉到注釋行上。

 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.