1. Linux 指令碼編寫基礎 1.1 文法基本介紹 1.1.1 開頭 程式必須以下面的行開始(必須方在檔案的第一行): #!/bin/sh 符號#!用來告訴系統它後面的參數是用來執行該檔案的程式。在這個例子中我們使用/bin/sh來執行程式。 當編輯好指令碼時,如果要執行該指令碼,還必須使其可執行。 要使指令碼可執行: 編譯 chmod +x filename 這樣才能用./filename 來運行1.1.2 注釋 在進行shell編程時,以#開頭的句子表示注釋,直到這一行的結束。我們真誠地建議您在程式中使用注釋。 如果您使用了注釋,那麼即使相當長的時間內沒有使用該指令碼,您也能在很短的時間內明白該指令碼的作用 及工作原理。 1.1.3 變數 在其他程式設計語言中您必須使用變數。在shell編程中,所有的變數都由字串組成,並且您不需要對變數 進行聲明。要賦值給一個變數,您可以這樣寫: #!/bin/sh #對變數賦值: a="hello world" # 現在列印變數a的內容: echo "A is:" echo $a 有時候變數名很容易與其他文字混淆,比如: num=2 echo "this is the $numnd" 這並不會列印出"this is the 2nd",而僅僅列印"this is the ",因為shell會去搜尋變數numnd的值, 但是這個變數時沒有值的。可以使用花括弧來告訴shell我們要列印的是num變數: num=2 echo "this is the ${num}nd" 這將列印: this is the 2nd 1.1.4 環境變數 由export關鍵字處理過的變數叫做環境變數。我們不對環境變數進行討論,因為通常情況下僅僅在登入 指令碼中使用環境變數。 1.1.5 Shell命令和流程式控制制 在shell指令碼中可以使用三類命令: 1)Unix 命令: 雖然在shell指令碼中可以使用任意的unix命令,但是還是由一些相對更常用的命令。這些命令通常是用來 進行檔案和文字操作的。 常用命令文法及功能 echo "some text": 將文字內容列印在螢幕上 ls: 檔案清單 wc –l filewc -w filewc -c file: 計算檔案行數計算檔案中的單詞數計算檔案中的字元數 cp sourcefile destfile: 檔案拷貝 mv oldname newname : 重新命名檔案或移動檔案 rm file: 刪除檔案 grep 'pattern' file: 在檔案內搜尋字串比如:grep 'searchstring' file.txt cut -b colnum file: 指定欲顯示的檔案內容約制,並將它們輸出到標準輸出裝置比如:輸出 每行第5個到第9個字元cut -b5-9 file.txt千萬不要和cat命令混淆, 這是兩個完全不同的命令 cat file.txt: 輸出檔案內容到標準輸出裝置(螢幕)上 file somefile: 得到檔案類型 read var: 提示使用者輸入,並將輸入賦值給變數 sort file.txt: 對file.txt檔案中的行進行排序 uniq: 刪除文字檔中出現的行列比如: sort file.txt | uniq expr: 進行數學運算Example: add 2 and 3expr 2 "+" 3 find: 搜尋檔案比如:根據檔案名稱搜尋find . -name filename -print tee: 將資料輸出到標準輸出裝置(螢幕) 和檔案比如:somecommand | tee outfile basename file: 返回不包含路徑的檔案名稱比如: basename /bin/tux將返回 tux dirname file: 返迴文件所在路徑比如:dirname /bin/tux將返回 /bin head file: 列印文字檔開頭幾行 tail file : 列印文字檔末尾幾行 sed: Sed是一個基本的尋找替換程式。可以從標準輸入(比如命令管道)讀入文本,並將 結果輸出到標準輸出(螢幕)。該命令採用Regex(見參考)進行搜尋。 不要和shell中的萬用字元相混淆。比如:將linuxfocus 替換為 LinuxFocus :cat text.file | sed 's/linuxfocus/LinuxFocus/' > newtext.file awk: awk 用來從文字檔中提取欄位。預設地,欄位分割符是空格,可以使用-F指定其他分割符。 cat file.txt | awk -F, '{print $1 "," $3 }'這裡我們使用,作為欄位分割符,同時列印 第一個和第三個欄位。如果該檔案內容如下: Adam Bor, 34, IndiaKerry Miller, 22, USA 命令輸出結果為:Adam Bor, IndiaKerry Miller, USA 2) 概念: 管道, 重新導向和 backtick 這些不是系統命令,但是他們真的很重要。 管道 (|) 將一個命令的輸出作為另外一個命令的輸入。 grep "hello" file.txt | wc -l 在file.txt中搜尋包含有”hello”的行並計算其行數。 在這裡grep命令的輸出作為wc命令的輸入。當然您可以使用多個命令。 重新導向:將命令的結果輸出到檔案,而不是標準輸出(螢幕)。 > 寫入檔案並覆蓋舊檔案 >> 加到檔案的尾部,保留舊檔案內容。 反短斜線 使用反短斜線可以將一個命令的輸出作為另外一個命令的一個命令列參數。 命令: find . -mtime -1 -type f -print 用來尋找過去24小時(-mtime –2則表示過去48小時)內修改過的檔案。如果您 想將所有尋找到的檔案打一個包,則可以使用以下指令碼: #!/bin/sh # The ticks are backticks (`) not normal quotes ('): tar -zcvf lastmod.tar.gz `find . -mtime -1 -type f -print` 3) 流程式控制制 1.if "if" 運算式 如果條件為真則執行then後面的部分: if ....; then .... elif ....; then .... else .... fi 大多數情況下,可以使用測試命令來對條件進行測試。比如可以比較字串、判斷檔案 是否存在及是否可讀等等… 通常用" [ ] "來表示條件測試。注意這裡的空格很重要。要確保方括弧的空格。 [ -f "somefile" ] :判斷是否是一個檔案 [ -x "/bin/ls" ] :判斷/bin/ls是否存在並有可執行許可權 [ -n "$var" ] :判斷$var變數是否有值 [ "$a" = "$b" ] :判斷$a和$b是否相等 執行man test可以查看所有測試運算式可以比較和判斷的類型。 直接執行以下指令碼: #!/bin/sh if [ "$SHELL" = "/bin/bash" ]; then echo "your login shell is the bash (bourne again shell)" else echo "your login shell is not bash but $SHELL" fi 變數$SHELL包含了登入shell的名稱,我們和/bin/bash進行了比較。 快捷操作符 熟悉C語言的朋友可能會很喜歡下面的運算式: [ -f "/etc/shadow" ] && echo "This computer uses shadow passwors" 這裡 && 就是一個快捷操作符,如果左邊的運算式為真則執行右邊的語句。 您也可以認為是邏輯運算中的與操作。上例中表示如果/etc/shadow檔案存在 則列印” This computer uses shadow passwors”。同樣或操作(||)在shell編程中也是 可用的。這裡有個例子: #!/bin/sh mailfolder=/var/spool/mail/james [ -r "$mailfolder" ]' '{ echo "Can not read $mailfolder" ; exit 1; } echo "$mailfolder has mail from:" grep "^From " $mailfolder 該指令碼首先判斷mailfolder是否可讀。如果可讀則列印該檔案中的"From" 一行。如果不可讀 則或操作生效,列印錯誤資訊後指令碼退出。這裡有個問題,那就是我們必須有兩個命令: -列印錯誤資訊 -退出程式 我們使用花括弧以匿名函數的形式將兩個命令放到一起作為一個命令使用。一般函數將在下文提及。 不用與和或操作符,我們也可以用if運算式作任何事情,但是使用與或操作符會更便利很多。 2.case case :運算式可以用來匹配一個給定的字串,而不是數字。 case ... in ...) do something here ;; esac 讓我們看一個例子。 file命令可以辨別出一個給定檔案的檔案類型,比如: file lf.gz 這將返回: lf.gz: gzip compressed data, deflated, original filename, last modified: Mon Aug 27 23:09:18 2001, os: Unix 我們利用這一點寫了一個叫做smartzip的指令碼,該指令碼可以自動解壓bzip2, gzip 和zip 類型的壓縮檔: #!/bin/sh ftype=`file "$1"` case "$ftype" in "$1: Zip archive"*) unzip "$1" ;; "$1: gzip compressed"*) gunzip "$1" ;; "$1: bzip2 compressed"*) bunzip2 "$1" ;; *) echo "File $1 can not be uncompressed with smartzip";; esac 您可能注意到我們在這裡使用了一個特殊的變數$1。該變數包含了傳遞給該程式的第一個參數值。 也就是說,當我們運行: smartzip articles.zip $1 就是字串 articles.zip 3. selsect select 運算式是一種bash的擴充應用,尤其擅長於互動式使用。使用者可以從一組不同的值中進行選擇。 select var in ... ; do break done .... now $var can be used .... 下面是一個例子: #!/bin/sh echo "What is your favourite OS?" select var in "Linux" "Gnu Hurd" "Free BSD" "Other"; do break done echo "You have selected $var" 下面是該指令碼啟動並執行結果: What is your favourite OS? 1) Linux 2) Gnu Hurd 3) Free BSD 4) Other #? 1 You have selected Linux 4.loop loop運算式: while ...; do .... done while-loop 將運行直到運算式測試為真。will run while the expression that we test for is true. 關鍵字"break" 用來跳出迴圈。而關鍵字”continue”用來不執行餘下的部分而直接跳到下一個迴圈。 for-loop運算式查看一個字串列表 (字串用空格分隔) 然後將其賦給一個變數: for var in ....; do .... done 在下面的例子中,將分別列印ABC到螢幕上: #!/bin/sh for var in A B C ; do echo "var is $var" done 下面是一個更為有用的指令碼showrpm,其功能是列印一些RPM包的統計資訊: #!/bin/sh # list a content summary of a number of RPM packages # USAGE: showrpm rpmfile1 rpmfile2 ... # EXAMPLE: showrpm /cdrom/RedHat/RPMS/*.rpm for rpmpackage in $*; do if [ -r "$rpmpackage" ];then echo "=============== $rpmpackage ==============" rpm -qi -p $rpmpackage else echo "ERROR: cannot read file $rpmpackage" fi done 這裡出現了第二個特殊的變數$*,該變數包含了所有輸入的命令列參數值。 如果您運行showrpm openssh.rpm w3m.rpm webgrep.rpm 此時 $* 包含了 3 個字串,即openssh.rpm, w3m.rpm and webgrep.rpm. 5. 引號 在向程式傳遞任何參數之前,程式會擴充萬用字元和變數。這裡所謂擴充的意思是程式會把萬用字元 (比如*)替換成合適的檔案名稱,它變數替換成變數值。為了防 止程式作這種替換,您可以使用 引號:讓我們來看一個例子,假設在目前的目錄下有一些檔案,兩個jpg檔案, mail.jpg 和tux.jpg。 1.2 編譯SHELL指令碼 #ch#!/bin/sh mod +x filename cho *.jpg ∪緩螅梢醞ü淙耄?./filename 來執行您的指令碼。 這將列印出"mail.jpg tux.jpg"的結果。 引號 (單引號和雙引號) 將防止這種萬用字元擴充: #!/bin/sh echo "*.jpg" echo '*.jpg' 這將列印"*.jpg" 兩次。 單引號更嚴格一些。它可以防止任何變數擴充。雙引號可以防止萬用字元擴充但允許變數擴充。 #!/bin/sh echo $SHELL echo "$SHELL" echo '$SHELL' 運行結果為: /bin/bash /bin/bash $SHELL 最後,還有一種防止這種擴充的方法,那就是使用逸出字元——反斜杆: echo *.jpg echo $SHELL 這將輸出: *.jpg $SHELL 6. Here documents 當要將幾行文字傳遞給一個命令時,here documents(譯者註:目前還沒有見到過對該詞適合的翻譯) 一種不錯的方法。對每個指令碼寫一段協助性的文字是很有用的,此時如果我們四有那個 here documents 就不必用echo函數一行行輸出。 一個 "Here document" 以 << 開頭,後面接上一個字串,這個字串 還必須出現在here document的末尾。下面是一個例子,在該例子中,我們對多個檔案進行重新命名,並且 使用here documents列印協助: #!/bin/sh # we have less than 3 arguments. Print the help text: if [ $# -lt 3 ] ; then cat < ren -- renames a number of files using sed regular expressions USAGE: ren 'regexp' 'replacement' files... EXAMPLE: rename all *.HTM files in *.html: ren 'HTM$' 'html' *.HTM HELP exit 0 fi OLD="$1" NEW="$2" # The shift command removes one argument from the list of # command line arguments. shift shift # $* contains now all the files: for file in $*; do if [ -f "$file" ] ; then newfile=`echo "$file" | sed "s/${OLD}/${NEW}/g"` if [ -f "$newfile" ]; then echo "ERROR: $newfile exists already" else echo "renaming $file to $newfile ..." mv "$file" "$newfile" fi fi done 這是一個複雜一些的例子。讓我們詳細討論一下。第一個if運算式判斷輸入命令列參數是 否小於3個 (特殊變數$# 表示包含參數的個數) 。如果輸入參數小於3個,則將協助文字傳遞 給cat命令,然後由cat命令將其列印在螢幕上。列印協助文字後程式退出。 如果輸入參數等 於或大於3個,我們就將第一個參數賦值給變數OLD,第二個參數賦值給變數NEW。下一步,我 們使用shift命令將第一個和第二個參數從 參數列表中刪除,這樣原來的第三個參數就成為參 數列表$*的第一個參數。然後我們開始迴圈,命令列參數列表被一個接一個地被賦值給變數$file。 接著我 們判斷該檔案是否存在,如果存在則通過sed命令搜尋和替換來產生新的檔案名稱。然後 將反短斜線內命令結果賦值給newfile。這樣我們就達到了我們的目 的:得到了舊檔案名稱和新 檔案名稱。然後使用mv命令進行重新命名。 4)函數 如果您寫了一些稍微複雜一些的程式,您就會發現在程式中可能在幾個地方使用了相同的代碼, 並且您也會發現,如果我們使用了函數,會方便很多。一個函數是這個樣子的: functionname() { # inside the body $1 is the first argument given to the function # $2 the second ... body } 您需要在每個程式的開始對函數進行聲明。 下面是一個叫做xtitlebar的指令碼,使用這個指令碼您可以改變終端視窗的名稱。 這裡使用了一個叫做help的函數。正如您可以看到的那樣,這個定義的函數被使用了兩次。 #!/bin/sh # vim: set sw=4 ts=4 et: help() { cat < xtitlebar -- change the name of an xterm, gnome-terminal or kde konsole USAGE: xtitlebar [-h] "string_for_titelbar" OPTIONS: -h help text EXAMPLE: xtitlebar "cvs" HELP exit 0 } # in case of error or if -h is given we call the function help: [ -z "$1" ] && help [ "$1" = "-h" ] && help # send the escape sequence to change the xterm titelbar: echo -e "33]0;$107" # 在指令碼中提供協助是一種很好的編程習慣,這樣方便其他使用者(和您)使用和理解指令碼。 命令列參數 我們已經見過$* 和 $1, $2 ... $9 等特殊變數,這些特殊變數包含了使用者從命令 行輸入的參數。迄今為止,我們僅僅瞭解了一些簡單的命令列文法(比如一些強制性的 參數和查看協助的-h選項)。 但是在編寫更複雜的程式時,您可能會發現您需要更多的 自訂的選項。通常的慣例是在所有可選的參數之前加一個減號,後面再加上參數值 ( 比如檔案名稱)。 有好多方法可以實現對輸入參數的分析,但是下面的使用case運算式的例子無遺是一個不錯的方法。 #!/bin/sh help() { cat < This is a generic command line parser demo. USAGE EXAMPLE: cmdparser -l hello -f -- -somefile1 somefile2 HELP exit 0 } while [ -n "$1" ]; do case $1 in -h) help;shift 1;; # function help is called -f) opt_f=1;shift 1;; # variable opt_f is set -l) opt_l=$2;shift 2;; # -l takes an argument -> shift by 2 --) shift;break;; # end of options -*) echo "error: no such option $1. -h for help";exit 1;; *) break;; esac done echo "opt_f is $opt_f" echo "opt_l is $opt_l" echo "first arg is $1" echo "2nd arg is $2" 您可以這樣運行該指令碼: cmdparser -l hello -f -- -somefile1 somefile2 返回的結果是: opt_f is 1 opt_l is hello first arg is -somefile1 2nd arg is somefile2 這個指令碼是如何工作的呢?指令碼首先在所有輸入命令列參數中進行迴圈,將輸入參數 與case運算式進行比較,如果匹配則設定一個變數並且移除該參數。根據unix系統的慣例, 首先輸入的應該是包含減號的參數. 第2部分 執行個體 現在我們來討論編寫一個指令碼的一般步驟。任何優秀的指令碼都應該具有協助和輸入參數。並且寫一個偽指令碼(framework.sh),該指令碼包含了大多數指令碼都需要的架構結構,是一個非常不錯的主意。這時候,在寫一個新的指令碼時我們只需要執行一下copy命令: cp framework.sh myscript 然後再插入自己的函數。 讓我們再看兩個例子: 二進位到十進位的轉換 指令碼 b2d 將位元 (比如 1101) 轉換為相應的十進位數。這也是一個用expr命令進行數學運算的例子: #!/bin/sh # vim: set sw=4 ts=4 et: help() { cat < b2h -- convert binary to decimal USAGE: b2h [-h] binarynum OPTIONS: -h help text EXAMPLE: b2h 111010 will return 58 HELP exit 0 } error() { # print an error and exit echo "$1" exit 1 } lastchar() { # return the last character of a string in $rval if [ -z "$1" ]; then # empty string rval="" return fi # wc puts some space behind the output this is why we need sed: numofchar=`echo -n "$1" | wc -c | sed 's/ //g' ` # now cut out the last char rval=`echo -n "$1" | cut -b $numofchar` } chop() { # remove the last character in string and return it in $rval if [ -z "$1" ]; then # empty string rval="" return fi # wc puts some space behind the output this is why we need sed: numofchar=`echo -n "$1" | wc -c | sed 's/ //g' ` if [ "$numofchar" = "1" ]; then # only one char in string rval="" return fi numofcharminus1=`expr $numofchar "-" 1` # now cut all but the last char: rval=`echo -n "$1" | cut -b 0-${numofcharminus1}` } while [ -n "$1" ]; do case $1 in -h) help;shift 1;; # function help is called --) shift;break;; # end of options -*) error "error: no such option $1. -h for help";; *) break;; esac done # The main program sum=0 weight=1 # one arg must be given: [ -z "$1" ] && help binnum="$1" binnumorig="$1" while [ -n "$binnum" ]; do lastchar "$binnum" if [ "$rval" = "1" ]; then sum=`expr "$weight" "+" "$sum"` fi # remove the last position in $binnum chop "$binnum" binnum="$rval" weight=`expr "$weight" "*" 2` done echo "binary $binnumorig is decimal $sum" 該指令碼使用的演算法是利用十進位和位元權值 (1,2,4,8,16,..),比如二進位"10"可 以這樣轉換成十進位: 0 * 1 + 1 * 2 = 2 為了得到單個的位元我們是用了lastchar 函數。該函數使用wc –c計算字元個數, 然後使用cut命令取出末尾一個字元。Chop函數的功能則是移除最後一個字元。 檔案迴圈程式 或許您是想將所有發出的郵件儲存到一個檔案中的人們中的一員,但是在過了幾個月 以後,這個檔案可能會變得很大以至於使對該檔案的訪問速度變慢。下面的 指令碼rotatefile 可以解決這個問題。這個指令碼可以重新命名郵件儲存檔案(假設為outmail)為outmail.1, 而對於outmail.1就變成了outmail.2 等等等等... #!/bin/sh # vim: set sw=4 ts=4 et: ver="0.1" help() { cat < rotatefile -- rotate the file name USAGE: rotatefile [-h] filename OPTIONS: -h help text EXAMPLE: rotatefile out This will e.g rename out.2 to out.3, out.1 to out.2, out to out.1 and create an empty out-file The max number is 10 version $ver HELP exit 0 } error() { echo "$1" exit 1 } while [ -n "$1" ]; do case $1 in -h) help;shift 1;; --) break;; -*) echo "error: no such option $1. -h for help";exit 1;; *) break;; esac done # input check: if [ -z "$1" ] ; then error "ERROR: you must specify a file, use -h for help" fi filen="$1" # rename any .1 , .2 etc file: for n in 9 8 7 6 5 4 3 2 1; do if [ -f "$filen.$n" ]; then p=`expr $n + 1` echo "mv $filen.$n $filen.$p" mv $filen.$n $filen.$p fi done # rename the original file: if [ -f "$filen" ]; then echo "mv $filen $filen.1" mv $filen $filen.1 fi echo touch $filen touch $filen 這個指令碼是如何工作的呢?在檢測使用者提供了一個檔案名稱以後,我們進行一個9到1的迴圈。檔案9被命名為10,檔案8重新命名為9等等。迴圈完成之後,我們將原始檔案命名為檔案1同時建立一個與原始檔案同名的空檔案。 調試 最簡單的調試命令當然是使用echo命令。您可以使用echo在任何懷疑出錯的地方列印任何變數值。這也是絕大多數的shell程式員要花費80%的時間來偵錯工具的原因。Shell程式的好處在於不需要重新編譯,插入一個echo命令也不需要多少時間。 shell也有一個真實的偵錯模式。如果在指令碼"strangescript" 中有錯誤,您可以這樣來進行調試: sh -x strangescript 這將執行該指令碼並顯示所有變數的值。 shell還有一個不需要執行指令碼只是檢查文法的模式。可以這樣使用: sh -n your_script 這將返回所有語法錯誤。 |