標籤:unix Regex shell 指令碼 編程
本文主要參考《sed&awk》。
我們平時使用的編輯器,比如vi,是互動編輯器,就是想修改哪個地方,就先定位到哪個地方,通常通過移動游標來完成。而sed是一個非互動面向字元流的編輯器,或者叫流編輯器。sed直接處理輸入資料流並將結果送到標準輸出。sed通過解釋指令碼來工作,該指令碼指定了將要執行的動作。
sed每次從輸入檔案中讀取一個輸入行,產生該輸入行的備份,並且對改備份執行指令碼中指定的指令操作。因此,對輸入行所做的改動不會影響到真正的輸入行。並且,sed的工作模式,是每次處理輸入資料流中的一行。假設有一個sed指令碼,名為scriptfile,我們可以通過 sed -f scriptfile inputfile 來執行。執行過程是,讀入輸入檔案inputfile中的第一行,scriptfile指令檔中的每一條語句對該行進行處理後,再讀入第二行,知道結束。這是sed的工作過程。
sed的簡單應用舉例:
sed ‘s/ MA/,Massachusetts/‘ list
該指令的意思是將list檔案中的MA替換為,Massachusetts,如果要指定多重指令,可以用-e,比如
sed -e ‘s/ MA/,Massachusetts/‘ -e ‘s/ PA/,Pennsylvania/‘ list
或者用分號隔開
sed ‘s/ MA/,Massachusetts/ ; s/ PA/,Pennsylvania/‘ list
指令sed -n -e ‘s/ MA/,Massachusetts/‘ list的意思是該行不輸出顯示,這就是-n的作用:組織輸入行的自動輸出。
sed主要有這三個命令列選項:
-e 表示編輯隨後的指令
-f 表示跟隨指令碼的檔案名稱
-n 表示組織輸入行的自動輸出。
基本的sed命令
文法格式:[address]command
address表示行地址,它可以是行號,Regex匹配的行等。後面的command就是sed指令了。
也可以用大括弧對多個指令進行分組,使得多個指令作用於同一行,格式如下:
address{
command1
command2
command3
}
注釋
和shell一樣,注釋用#
替換
[address] s/pattern/replacement/flags
意思是對address行中與pattern匹配的部分替換成replacement。
其中,flags有幾種取值:
n 1到512之間的一個數字,表示對本模式中指定模式第n次出現的情況進行替換。
g 對模式空間的所有出現的情況進行全域更改,而預設情況下只是替換第一次出現的情況。
p 列印模式空間的內容
w file 將模式空間中的內容寫到file檔案。
刪除 d
比如刪除空行: /^$/d
d前面的就是我們所說的adress部分,表示這些行,這裡是指空行,d將這些行刪除。
追加、插入和更改
[address]a\
text
[address]i\
text
[address]c\
text
插入命令將所提供的文本text放置在模式空間的當前行之前,追加命令將文本放置在當前行之後,更改命令用所提供的文本取代模式空間的內容。
列表
列表命令為l,用於顯示模式空間的內容,將非列印的字元顯示為兩個數位ASCII代碼。
轉換
[address] y/abc/xyz
該命令將字串abc中的每個字元轉換為字串xyz中的等價字元。
退出命令
q
該命令使得sed停止讀取新的輸入行,並停止將它們發送到輸出。
shell指令碼編程學習筆記(3)sed命令的使用