每天學一點shell--------文本處理相關

來源:互聯網
上載者:User

標籤:使用   os   io   檔案   資料   line   amp   new   

  • 1. Sed簡介  
  • sed 是 一種線上編輯器,它一次處理一行內容。處理時,把當前處理的行儲存在臨時緩衝區中,稱為“模式空間”(pattern space),接著用sed命令處 理緩衝區中的內容,處理完成後,把緩衝區的內容送往螢幕。接著處理下一行,這樣不斷重複,直到檔案末尾。檔案內容並沒有 改變,除非你使用重新導向儲存輸 出。Sed主要用來自動編輯一個或多個檔案;簡化對檔案的反覆操作;編寫轉換程式等。以下介紹的是Gnu版本的Sed 3.02。  
  • 2. 定址  
  • 可以通過定址來定位你所希望編輯的行,該地址用數字構成,用逗號分隔的兩個行數表示以這兩行為起止的行的範圍(包括行數表示的那兩行)。如1,3表示1,2,3行,貨幣符號($)表示最後一行。範圍可以通過資料,Regex或者二者結合的方式確定 。  
  •   
  • 3. Sed命令  
  • 調用sed命令有兩種形式:  
  • *  
  • sed [options] ‘command‘ file(s)  
  • *  
  • sed [options] -f scriptfile file(s)  
  • a\  
  • 在當前行後面加入一行文本。  
  • b lable  
  • 分支到指令碼中帶有標記的地方,如果分支不存在則分支到指令碼的末尾。  
  • c\  
  • 用新的文本改變本行的文本。  
  • d  
  • 從模板塊(Pattern space)位置刪除行。  
  • D  
  • 刪除模板塊的第一行。  
  • i\  
  • 在當前行上面插入文本。  
  • h  
  • 拷貝模板塊的內容到記憶體中的緩衝區。  
  • H  
  • 追加模板塊的內容到記憶體中的緩衝區  
  • g  
  • 獲得記憶體緩衝區的內容,並替代當前模板塊中的文本。  
  • G  
  • 獲得記憶體緩衝區的內容,並追加到當前模板塊文本的後面。  
  • l  
  • 列表不能列印字元的清單。  
  • n  
  • 讀取下一個輸入行,用下一個命令處理新的行而不是用第一個命令。  
  • N  
  • 追加下一個輸入行到模板塊後面並在二者間嵌入一個新行,改變當前行號碼。  
  • p  
  • 列印模板塊的行。  
  • P(大寫)  
  • 列印模板塊的第一行。  
  • q  
  • 退出Sed。  
  • r file  
  • 從file中讀行。  
  • t label  
  • if分支,從最後一行開始,條件一旦滿足或者T,t命令,將導致分支到帶有標號的命令處,或者到指令碼的末尾。  
  • T label  
  • 錯誤分支,從最後一行開始,一旦發生錯誤或者T,t命令,將導致分支到帶有標號的命令處,或者到指令碼的末尾。  
  • w file  
  • 寫並追加模板塊到file末尾。  
  • W file  
  • 寫並追加模板塊的第一行到file末尾。  
  • !  
  • 表示後面的命令對所有沒有被選定的行發生作用。  
  • s/re/string  
  • 用string替換Regexre。  
  • =  
  • 列印當前行號碼。  
  • #  
  • 把注釋擴充到下一個分行符號以前。  
  • 以下的是替換標記  
  • *  
  • g表示行內全面替換。  
  • *  
  • p表示列印行。  
  • *  
  • w表示把行寫入一個檔案。  
  • *  
  • x表示互換模板塊中的文本和緩衝區中的文本。  
  • *  
  • y表示把一個字元翻譯為另外的字元(但是不用於Regex)  
  •   
  • 4. 選項  
  • -e command, --expression=command  
  • 允許多台編輯。  
  • -h, --help  
  • 列印協助,並顯示bug列表的地址。  
  • -n, --quiet, --silent  
  •   
  • 取消預設輸出。  
  • -f, --filer=script-file  
  • 引導sed指令檔名。  
  • -V, --version  
  • 列印版本和著作權資訊。  
  •   
  • 5. 元字元集^  
  • 錨定行的開始 如:/^sed/匹配所有以sed開頭的行。   
  • $  
  • 錨定行的結束 如:/sed$/匹配所有以sed結尾的行。   
  • .  
  • 匹配一個非分行符號的字元 如:/s.d/匹配s後接一個任一字元,然後是d。   
  • *  
  • 匹配零或多個字元 如:/*sed/匹配所有模板是一個或多個空格後緊跟sed的行。  
  • [] 
  • 匹配一個指定範圍內的字元,如/[Ss]ed/匹配sed和Sed。  
  • [^] 
  • 匹配一個不在指定範圍內的字元,如:/[^A-RT-Z]ed/匹配不包含A-R和T-Z的一個字母開頭,緊跟ed的行。  
  • \(..\) 
  • 儲存匹配的字元,如s/\(love\)able/\1rs,loveable被替換成lovers。  
  • 儲存搜尋字元用來替換其他字元,如s/love/**&**/,love這成**love**。   
  • \<  
  • 錨定單詞的開始,如:/\<love/匹配包含以love開頭的單詞的行。   
  • \>  
  • 錨定單詞的結束,如/love\>/匹配包含以love結尾的單詞的行。   
  • x\{m\}  
  • 重複字元x,m次,如:/0\{5\}/匹配包含5個o的行。   
  • x\{m,\}  
  • 重複字元x,至少m次,如:/o\{5,\}/匹配至少有5個o的行。   
  • x\{m,n\}  
  • 重複字元x,至少m次,不多於n次,如:/o\{5,10\}/匹配5--10個o的行。  
  • 6. 執行個體  
  • 刪除:d命令  
  • *  
  • $ sed ‘2d‘ example-----刪除example檔案的第二行。  
  • *  
  • $ sed ‘2,$d‘ example-----刪除example檔案的第二行到末尾所有行。  
  • *  
  • $ sed ‘$d‘ example-----刪除example檔案的最後一行。  
  • *  
  • $ sed ‘/test/‘d example-----刪除example檔案所有包含test的行。  
  • 替換:s命令  
  • *  
  • $ sed ‘s/test/mytest/g‘ example-----在整行範圍內把test替換為mytest。如果沒有g標記,則只有每行第一個匹配的test被替換成mytest。  
  • *  
  • $ sed -n ‘s/^test/mytest/p‘ example-----(-n)選項和p標誌一起使用表示只列印那些發生替換的行。也就是說,如果某一行開頭的test被替換成mytest,就列印它。  
  • *  
  • $ sed ‘s/^192.168.0.1/&localhost/‘ example-----&符號表示替換換字串中被找到的部份。所有以192.168.0.1開頭的行都會被替換成它自已加 localhost,變成192.168.0.1localhost。  
  • *  
  • $ sed -n ‘s/\(love\)able/\1rs/p‘ example-----love被標記為1,所有loveable會被替換成lovers,而且替換的行會被列印出來。  
  • *  
  • $ sed ‘s#10#100#g‘ example-----不論什麼字元,緊跟著s命令的都被認為是新的分隔字元,所以,“#”在這裡是分隔字元,代替了預設的“/”分隔字元。表示把所有10替換成100。  
  • 選定行的範圍:逗號  
  • *  
  • $ sed -n ‘/test/,/check/p‘ example-----所有在模板test和check所確定的範圍內的行都被列印。  
  • *  
  • $ sed -n ‘5,/^test/p‘ example-----列印從第五行開始到第一個包含以test開始的行之間的所有行。  
  • *  
  • $ sed ‘/test/,/check/s/$/sed test/‘ example-----對於模板test和west之間的行,每行的末尾用字串sed test替換。  
  • 多點編輯:e命令  
  • *  
  • $ sed -e ‘1,5d‘ -e ‘s/test/check/‘ example-----(-e)選項允許在同一行裡執行多條命令。如例子所示,第一條命令刪除1至5行,第二條命令用check替換test。命令的執 行順序對結果有影響。如果兩個命令都是替換命令,那麼第一個替換命令將影響第二個替換命令的結果。  
  • *  
  • $ sed --expression=‘s/test/check/‘ --expression=‘/love/d‘ example-----一個比-e更好的命令是--expression。它能給sed運算式賦值。  
  • 從檔案讀入:r命令  
  • *  
  • $ sed ‘/test/r file‘ example-----file裡的內容被讀進來,顯示在與test匹配的行後面,如果匹配多行,則file的內容將顯示在所有匹配行的下面。  
  • 寫入檔案:w命令  
  • *  
  • $ sed -n ‘/test/w file‘ example-----在example中所有包含test的行都被寫入file裡。  
  • 追加命令:a命令  
  • *  
  • $ sed ‘/^test/a\\--->this is a example‘ example<-----‘this is a example‘被追加到以test開頭的行後面,sed要求命令a後面有一個反斜線。  
  • 插入:i命令  
  • $ sed ‘/test/i\\  
  • new line  
  • -------------------------‘ example  
  • 如果test被匹配,則把反斜線後面的文本插入到匹配行的前面。  
  • 下一個:n命令  
  • *  
  • $ sed ‘/test/{ n; s/aa/bb/; }‘ example-----如果test被匹配,則移動到匹配行的下一行,替換這一行的aa,變為bb,並列印該行,然後繼續。  
  • 變形:y命令  
  • *  
  • $ sed ‘1,10y/abcde/ABCDE/‘ example-----把1--10行內所有abcde轉變為大寫,注意,Regex元字元不能使用這個命令。  
  • 退出:q命令  
  • *  
  • $ sed ‘10q‘ example-----列印完第10行後,退出sed。  
  • 保持和擷取:h命令和G命令  
  • *  
  • $ sed -e ‘/test/h‘ -e ‘$G example----- 在sed處理檔案的時候,每一行都被儲存在一個叫模式空間的臨時緩衝區中,除非行被刪除或者輸出被取消,否則所有被處理的行都將 列印在螢幕上。接著模式 空間被清空,並存入新的一行等待處理。在這個例子裡,匹配test的行被找到後,將存入模式空間,h命令將其複製並存入一個稱為保 持緩衝區的特殊緩衝區 內。第二條語句的意思是,當到達最後一行後,G命令取出保持緩衝區的行,然後把它放回模式空間中,且追加到現在已經存在於模式空間中 的行的末尾。在這個 例子中就是追加到最後一行。簡單來說,任何包含test的行都被複製並追加到該檔案的末尾。  
  • 保持和互換:h命令和x命令  
  • *  
  • $ sed -e ‘/test/h‘ -e ‘/check/x‘ example -----互換模式空間和保持緩衝區的內容。也就是把包含test與check的行互換。  
  • 7. 指令碼  
  • Sed指令碼是一個sed的命令清單,啟動Sed時以-f選項引導指令檔名。Sed對於指令碼中輸入的命令非常挑剔,在命令的末尾不能有任何空白或文本,如果在一行中有多個命令,要用分號分隔。以#開頭的行為注釋行,且不能跨行。
相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.