文章目錄
本文結合大量執行個體闡述如何編寫一個shell指令碼。
為什麼要進行shell編程
在Linux系統中,雖然有各種各樣的圖形化介面工具,但是sell仍然是一個非常靈活的工具。Shell不僅僅是命令的收集,而且是一門非常棒的程式設計語言。您可以通過使用shell使大量的任務自動化,shell特別擅長系統管理任務,尤其適合那些易用性、可維護性和便攜性比效率更重要的任務。
下面,讓我們一起來看看shell是如何工作的:
建立一個指令碼
Linux中有好多中不同的shell,但是通常我們使用bash (bourne again shell) 進行shell編程,因為bash是免費的並且很容易使用。所以在本文中筆者所提供的指令碼都是使用bash(但是在大多數情況下,這些指令碼同樣可以在bash的大姐,bourne shell 中運行)。
如同其他語言一樣,通過我們使用任意一種文字編輯器,比如nedit、kedit、emacs、vi等來編寫我們的shell程式。程式必須以下面的行開始(必須方在檔案的第一行):
#!/bin/sh
符號#!用來告訴系統它後面的參數是用來執行該檔案的程式。在這個例子中我們使用/bin/sh來執行程式。
當編輯好指令碼時,如果要執行該指令碼,還必須使其可執行。
要使指令碼可執行:
chmod +x filename
然後,您可以通過輸入: ./filename 來執行您的指令碼。
注釋
在進行shell編程時,以#開頭的句子表示注釋,直到這一行的結束。我們真誠地建議您在程式中使用注釋。如果您使用了注釋,那麼即使相當長的時間內沒有使用該指令碼,您也能在很短的時間內明白該指令碼的作用及工作原理。
變數
在其他程式設計語言中您必須使用變數。在shell編程中,所有的變數都由字串組成,並且您不需要對變數進行聲明。要賦值給一個變數,您可以這樣寫:
變數名=值
取出變數值可以加一個貨幣符號($)在變數前面:
#!/bin/sh
#對變數賦值:
a="hello world"
# 現在列印變數a的內容:
echo "A is:"
echo $a
在您的編輯器中輸入以上內容,然後將其儲存為一個檔案first。之後執行chmod +x first 使其可執行,最後輸入./first執行該指令碼。
這個指令碼將會輸出:
A is:
hello world
有時候變數名很容易與其他文字混淆,比如:
num=2
echo "this is the $numnd"
這並不會列印出"this is the 2nd",而僅僅列印"this is the ",因為shell會去搜尋變數numnd的值,但是這個變數時沒有值的。可以使用花括弧來告訴shell我們要列印的是num變數:
num=2
echo "this is the ${num}nd"
這將列印: this is the 2nd
有許多變數是系統自動設定的,這將在後面使用這些變數時進行討論。
如果您需要處理數學運算式,那麼您需要使用諸如expr等程式(見下面)。
除了一般的僅在程式內有效shell變數以外,還有環境變數。由export關鍵字處理過的變數叫做環境變數。我們不對環境變數進行討論,因為通常情況下僅僅在登入指令檔中使用環境變數。
Shell命令和流程式控制制
在shell指令碼中可以使用三類命令:
1)Unix 命令:
雖然在shell指令碼中可以使用任意的unix命令,但是還是由一些相對更常用的命令。這些命令通常是用來進行檔案和文字操作的。
常用命令文法及功能
echo "some text": 將文字內容列印在螢幕上
ls: 檔案清單
wc -l filewc -w filewc -c file&: 計算檔案行數計算檔案中的單詞數計算檔案中的字元數
cp sourcefile destfile&: 檔案拷貝
mv oldname newname : 重新命名檔案或移動檔案
rm file&: 刪除檔案
grep 'pattern' file&: 在檔案內搜尋字串比如:grep 'searchstring' file.txt
cut -b colnum file&: 指定欲顯示的檔案內容約制,並將它們輸出到標準輸出裝置比如:輸出每行第5個到第9個字元cut -b5-9 file.txt千萬不要和cat命令混淆,這是兩個完全不同的命令
cat file.txt: 輸出檔案內容到標準輸出裝置(螢幕)上
file somefile&: 得到檔案類型
read var: 提示使用者輸入,並將輸入賦值給變數
sort file.txt: 對file.txt檔案中的行進行排序
uniq: 刪除文字檔中出現的行列比如: sort file.txt | uniq
expr: 進行數學運算Example: add 2 and 3expr 2 "+" 3
find: 搜尋檔案比如:根據檔案名稱搜尋find . -name filename -print
tee: 將資料輸出到標準輸出裝置(螢幕) 和檔案比如:somecommand | tee outfile
basename file&: 返回不包含路徑的檔案名稱比如: basename /bin/tux將返回 tux
dirname file&: 返迴文件所在路徑比如:dirname /bin/tux將返回 /bin
head file&: 列印文字檔開頭幾行
tail file : 列印文字檔末尾幾行
sed: Sed是一個基本的尋找替換程式。可以從標準輸入(比如命令管道)讀入文本,並將結果輸出到標準輸出(螢幕)。該命令採用Regex(見參考)進行搜尋。不要和shell中的萬用字元相混淆。比如:將linuxfocus 替換為 LinuxFocus :cat text.file | sed 's/linuxfocus/LinuxFocus /' > newtext.file
awk: awk 用來從文字檔中提取欄位。預設地,欄位分割符是空格,可以使用-F 指定其他分割符。cat file.txt | awk -F, '{print $1 "," $3 }'這裡我們使用,作為欄位分割符,同時列印第一個和第三個欄位。如果該檔案內容如下: Adam Bor, 34, IndiaKerry Miller, 22, USA命令輸出結果為:Adam Bor, IndiaKerry Miller, USA
2) 概念: 管道, 重新導向和 backtick
這些不是系統命令,但是他們真的很重要。
管道 (|) 將一個命令的輸出作為另外一個命令的輸入。
grep "hello" file.txt | wc -l
在file.txt中搜尋包含有"hello"的行並計算其行數。
在這裡grep命令的輸出作為wc命令的輸入。當然您可以使用多個命令。
重新導向:將命令的結果輸出到檔案,而不是標準輸出(螢幕)。
> 寫入檔案並覆蓋舊檔案
>> 加到檔案的尾部,保留舊檔案內容。
反短斜線
使用反短斜線可以將一個命令的輸出作為另外一個命令的一個命令列參數。
命令:
find . -mtime -1 -type f -print
用來尋找過去24小時(-mtime -2則表示過去48小時)內修改過的檔案。如果您想將所有尋找到的檔案打一個包,則可以使用以下指令碼:
#!/bin/sh
# The ticks are backticks (`) not normal quotes ('):
tar -zcvf lastmod.tar.gz `find . -mtime -1 -type f -print`
3) 流程式控制制
"if" 運算式 如果條件為真則執行then後面的部分:
if ....; then
....
elif ....; then
....
else
....
fi
大多數情況下,可以使用測試命令來對條件進行測試。比如可以比較字串、判斷檔案是否存在及是否可讀等等...
通常用" [ ] "來表示條件測試。注意這裡的空格很重要。要確保方括弧的空格。
[ -f "somefile" ] :判斷是否是一個檔案
[ -x "/bin/ls" ] :判斷/bin/ls是否存在並有可執行許可權
[ -n "$var" ] :判斷$var變數是否有值
[ "$a" = "$b" ] :判斷$a和$b是否相等
執行man test可以查看所有測試運算式可以比較和判斷的類型。
直接執行以下指令碼:
#!/bin/sh
if [ "$SHELL" = "/bin/bash" ]; then
echo "your login shell is the bash (bourne again shell)"
else
echo "your login shell is not bash but $SHELL"
fi
變數$SHELL包含了登入shell的名稱,我們和/bin/bash進行了比較。
快捷操作符
熟悉C語言的朋友可能會很喜歡下面的運算式:
[ -f "/etc/shadow" ] && echo "This computer uses shadow passwors"
這裡 && 就是一個快捷操作符,如果左邊的運算式為真則執行右邊的語句。您也可以認為是邏輯運算中的與操作。上例中表示如果/etc /shadow檔案存在則列印" This computer uses shadow passwors"。同樣或操作(||)在shell編程中也是可用的。這裡有個例子:
#!/bin/sh
mailfolder=/var/spool/mail/james
[ -r "$mailfolder" ]' '{ echo "Can not read $mailfolder" exit 1; }
echo "$mailfolder has mail from:"
grep "^From " $mailfolder
該指令碼首先判斷mailfolder是否可讀。如果可讀則列印該檔案中的"From" 一行。如果不可讀則或操作生效,列印錯誤資訊後指令碼退出。這裡有個問題,那就是我們必須有兩個命令:
-列印錯誤資訊
-退出程式
我們使用花括弧以匿名函數的形式將兩個命令放到一起作為一個命令使用。一般函數將在下文提及。
不用與和或操作符,我們也可以用if運算式作任何事情,但是使用與或操作符會更便利很多。
case運算式可以用來匹配一個給定的字串,而不是數字。
case ... in
...) do something here
esac
讓我們看一個例子。 file命令可以辨別出一個給定檔案的檔案類型,比如:
file lf.gz
這將返回:
lf.gz: gzip compressed data, deflated, original filename,
last modified: Mon Aug 27 23:09:18 2001, os: Unix
我們利用這一點寫了一個叫做smartzip的指令碼,該指令碼可以自動解壓bzip2, gzip 和zip 類型的壓縮檔:
#!/bin/sh
ftype=`file "$1"`
case "$ftype" in
"$1: Zip archive"*)
unzip "$1"
"$1: gzip compressed"*)
gunzip "$1"
"$1: bzip2 compressed"*)
bunzip2 "$1"
*) error "File $1 can not be uncompressed with smartzip";;
esac
您可能注意到我們在這裡使用了一個特殊的變數$1。該變數包含了傳遞給該程式的第一個參數值。也就是說,當我們運行:
smartzip articles.zip
$1 就是字串 articles.zip
select 運算式是一種bash的擴充應用,尤其擅長於互動式使用。使用者可以從一組不同的值中進行選擇。
select var in ... do
break
done
.... now $var can be used ....
下面是一個例子:
#!/bin/sh
echo "What is your favourite OS?"
select var in "Linux" "Gnu Hurd" "Free BSD" "Other"; do
break
done
echo "You have selected $var"
下面是該指令碼啟動並執行結果:
What is your favourite OS?
1) Linux
2) Gnu Hurd
3) Free BSD
4) Other
#? 1
You have selected Linux
您也可以在shell中使用如下的loop運算式:
while ...; do
....
done
while- loop 將運行直到運算式測試為真。 will run while the expression that we test for is true. 關鍵字"break" 用來跳出迴圈。而關鍵字"continue"用來不執行餘下的部分而直接跳到下一個迴圈。
for-loop運算式查看一個字串列表 (字串用空格分隔) 然後將其賦給一個變數:
for var in ....; do
....
done
在下面的例子中,將分別列印ABC到螢幕上:
#!/bin/sh
for var in A B C do
echo "var is $var"
done
下面是一個更為有用的指令碼showrpm,其功能是列印一些RPM包的統計資訊:
#!/bin/sh
# list a content summary of a number of RPM packages
# USAGE: showrpm rpmfile1 rpmfile2 ...
# EXAMPLE: showrpm /cdrom/RedHat/RPMS/*.rpm
for rpmpackage in $*; do
if [ -r "$rpmpackage" ];then
echo "=============== $rpmpackage =============="
rpm -qi -p $rpmpackage
else
echo "ERROR: cannot read file $rpmpackage"
fi
done
這裡出現了第二個特殊的變數$*,該變數包含了所有輸入的命令列參數值。如果您運行showrpm openssh.rpm w3m.rpm webgrep.rpm
此時 $* 包含了 3 個字串,即openssh.rpm, w3m.rpm and webgrep.rpm.
引號
在向程式傳遞任何參數之前,程式會擴充萬用字元和變數。這裡所謂擴充的意思是程式會把萬用字元(比如*)替換成合適的檔案名稱,它變數替換成變數值。為了防止程式作這種替換,您可以使用引號:讓我們來看一個例子,假設在目前的目錄下有一些檔案,兩個jpg檔案, mail.jpg 和tux.jpg。
#!/bin/sh
echo *.jpg
這將列印出"mail.jpg tux.jpg"的結果。
引號 (單引號和雙引號) 將防止這種萬用字元擴充:
#!/bin/sh
echo "*.jpg"
echo '*.jpg'
這將列印"*.jpg" 兩次。
單引號更嚴格一些。它可以防止任何變數擴充。雙引號可以防止萬用字元擴充但允許變數擴充。
#!/bin/sh
echo $SHELL
echo "$SHELL"
echo '$SHELL'
運行結果為:
/bin/bash
/bin/bash
$SHELL
最後,還有一種防止這種擴充的方法,那就是使用逸出字元——反斜杆:
echo *.jpg
echo $SHELL
這將輸出:
*.jpg
$SHELL
Here document.
當要將幾行文字傳遞給一個命令時,here document.(譯者註:目前還沒有見到過對該詞適合的翻譯)一種不錯的方法。對每個指令碼寫一段協助性的文字是很有用的,此時如果我們四有那個here document.就不必用echo函數一行行輸出。 一個 "Here document.quot; 以 << 開頭,後面接上一個字串,這個字串還必須出現在here document.末尾。下面是一個例子,在該例子中,我們對多個檔案進行重新命名,並且使用here document.列印協助:
#!/bin/sh
# we have less than 3 arguments. Print the help text:
if [ $# -lt 3 ] then
cat <<HELP
ren -- renames a number of files using sed regular expressions
USAGE: ren 'regexp' 'replacement' files...
EXAMPLE: rename all *.HTM files in *.html:
ren 'HTM$' 'html' *.HTM
HELP
exit 0
fi
OLD="$1"
NEW="$2"
# The shift command removes one argument from the list of
# command line arguments.
shift
shift
# $* contains now all the files:
for file in $*; do
if [ -f "$file" ] then
newfile=`echo "$file" | sed "s/${OLD}/${NEW}/g"`
if [ -f "$newfile" ]; then
echo "ERROR: $newfile exists already"
else
echo "renaming $file to $newfile ..."
mv "$file" "$newfile"
fi
fi
done
這是一個複雜一些的例子。讓我們詳細討論一下。第一個if運算式判斷輸入命令列參數是否小於3個 (特殊變數$# 表示包含參數的個數) 。如果輸入參數小於3個,則將協助文字傳遞給cat命令,然後由cat命令將其列印在螢幕上。列印協助文字後程式退出。 如果輸入參數等於或大於3個,我們就將第一個參數賦值給變數OLD,第二個參數賦值給變數NEW。下一步,我們使用shift命令將第一個和第二個參數從參數列表中刪除,這樣原來的第三個參數就成為參數列表$*的第一個參數。然後我們開始迴圈,命令列參數列表被一個接一個地被賦值給變數$file。接著我們判斷該檔案是否存在,如果存在則通過sed命令搜尋和替換來產生新的檔案名稱。然後將反短斜線內命令結果賦值給newfile。這樣我們就達到了我們的目的:得到了舊檔案名稱和新檔案名稱。然後使用mv命令進行重新命名。
函數
如果您寫了一些稍微複雜一些的程式,您就會發現在程式中可能在幾個地方使用了相同的代碼,並且您也會發現,如果我們使用了函數,會方便很多。一個函數是這個樣子的:
functionname()
{
# inside the body $1 is the first argument given to the function
# $2 the second ...
body
}
您需要在每個程式的開始對函數進行聲明。
下面是一個叫做xtitlebar的指令碼,使用這個指令碼您可以改變終端視窗的名稱。這裡使用了一個叫做help的函數。正如您可以看到的那樣,這個定義的函數被使用了兩次。
#!/bin/sh
# vim: set sw=4 ts=4 et:
help()
{
cat <<HELP
xtitlebar -- change the name of an xterm, gnome-terminal or kde konsole
USAGE: xtitlebar [-h] "string_for_titelbar"
OPTIONS: -h help text
EXAMPLE: xtitlebar "cvs"
HELP
exit 0
}
# in case of error or if -h is given we call the function help:
[ -z "$1" ] && help
[ "$1" = "-h" ] && help
# send the escape sequence to change the xterm titelbar:
echo -e "33]0;$107"
#
在指令碼中提供協助是一種很好的編程習慣,這樣方便其他使用者(和您)使用和理解指令碼。
命令列參數
我們已經見過$* 和 $1, $2 ... $9 等特殊變數,這些特殊變數包含了使用者從命令列輸入的參數。迄今為止,我們僅僅瞭解了一些簡單的命令列文法(比如一些強制性的參數和查看協助的-h選項)。但是在編寫更複雜的程式時,您可能會發現您需要更多的自訂的選項。通常的慣例是在所有可選的參數之前加一個減號,後面再加上參數值 (比如檔案名稱)。
有好多方法可以實現對輸入參數的分析,但是下面的使用case運算式的例子無遺是一個不錯的方法。
#!/bin/sh
help()
{
cat <<HELP
This is a generic command line parser demo.
USAGE EXAMPLE: cmdparser -l hello -f -- -somefile1 somefile2
HELP
exit 0
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;; # function help is called
-f) opt_f=1;shift 1;; # variable opt_f is set
-l) opt_l=$2;shift 2;; # -l takes an argument -> shift by 2
--) shift;break;; # end of options
-*) echo "error: no such option $1. -h for help";exit 1;;
*) break;;
esac
done
echo "opt_f is $opt_f"
echo "opt_l is $opt_l"
echo "first arg is $1"
echo "2nd arg is $2"
您可以這樣運行該指令碼:
cmdparser -l hello -f -- -somefile1 somefile2
返回的結果是:
opt_f is 1
opt_l is hello
first arg is -somefile1
2nd arg is somefile2
這個指令碼是如何工作的呢?指令碼首先在所有輸入命令列參數中進行迴圈,將輸入參數與case運算式進行比較,如果匹配則設定一個變數並且移除該參數。根據unix系統的慣例,首先輸入的應該是包含減號的參數。
執行個體
一般編程步驟
現在我們來討論編寫一個指令碼的一般步驟。任何優秀的指令碼都應該具有協助和輸入參數。並且寫一個偽指令碼(framework.sh),該指令碼包含了大多數指令碼都需要的架構結構,是一個非常不錯的主意。這時候,在寫一個新的指令碼時我們只需要執行一下copy命令:
cp framework.sh myscript
然後再插入自己的函數。
讓我們再看兩個例子:
二進位到十進位的轉換
指令碼 b2d 將位元 (比如 1101) 轉換為相應的十進位數。這也是一個用expr命令進行數學運算的例子:
#!/bin/sh
# vim: set sw=4 ts=4 et:
help()
{
cat <<HELP
b2h -- convert binary to decimal
USAGE: b2h [-h] binarynum
OPTIONS: -h help text
EXAMPLE: b2h 111010
will return 58
HELP
exit 0
}
error()
{
# print an error and exit
echo "$1"
exit 1
}
lastchar()
{
# return the last character of a string in $rval
if [ -z "$1" ]; then
# empty string
rval=""
return
fi
# wc puts some space behind the output this is why we need sed:
numofchar=`echo -n "$1" | wc -c | sed 's/ //g' `
# now cut out the last char
rval=`echo -n "$1" | cut -b $numofchar`
}
chop()
{
# remove the last character in string and return it in $rval
if [ -z "$1" ]; then
# empty string
rval=""
return
fi
# wc puts some space behind the output this is why we need sed:
numofchar=`echo -n "$1" | wc -c | sed 's/ //g' `
if [ "$numofchar" = "1" ]; then
# only one char in string
rval=""
return
fi
numofcharminus1=`expr $numofchar "-" 1`
# now cut all but the last char:
rval=`echo -n "$1" | cut -b 0-${numofcharminus1}`
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;; # function help is called
--) shift;break;; # end of options
-*) error "error: no such option $1. -h for help";;
*) break;;
esac
done
# The main program
sum=0
weight=1
# one arg must be given:
[ -z "$1" ] && help
binnum="$1"
binnumorig="$1"
while [ -n "$binnum" ]; do
lastchar "$binnum"
if [ "$rval" = "1" ]; then
sum=`expr "$weight" "+" "$sum"`
fi
# remove the last position in $binnum
chop "$binnum"
binnum="$rval"
weight=`expr "$weight" "*" 2`
done
echo "binary $binnumorig is decimal $sum"
#
該指令碼使用的演算法是利用十進位和位元權值 (1,2,4,8,16,..),比如二進位"10"可以這樣轉換成十進位:
0 * 1 + 1 * 2 = 2
為了得到單個的位元我們是用了lastchar 函數。該函數使用wc -c計算字元個數,然後使用cut命令取出末尾一個字元。Chop函數的功能則是移除最後一個字元。
檔案迴圈程式
或許您是想將所有發出的郵件儲存到一個檔案中的人們中的一員,但是在過了幾個月以後,這個檔案可能會變得很大以至於使對該檔案的訪問速度變慢。下面的指令碼rotatefile 可以解決這個問題。這個指令碼可以重新命名郵件儲存檔案(假設為outmail)為outmail.1,而對於outmail.1就變成了outmail.2 等等等等...
#!/bin/sh
# vim: set sw=4 ts=4 et:
ver="0.1"
help()
{
cat <<HELP
rotatefile -- rotate the file name
USAGE: rotatefile [-h] filename
OPTIONS: -h help text
EXAMPLE: rotatefile out
This will e.g rename out.2 to out.3, out.1 to out.2, out to out.1
and create an empty out-file
The max number is 10
version $ver
HELP
exit 0
}
error()
{
echo "$1"
exit 1
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;;
--) break;;
-*) echo "error: no such option $1. -h for help";exit 1;;
*) break;;
esac
done
# input check:
if [ -z "$1" ] then
error "ERROR: you must specify a file, use -h for help"
fi
filen="$1"
# rename any .1 , .2 etc file&:
for n in 9 8 7 6 5 4 3 2 1; do
if [ -f "$filen.$n" ]; then
p=`expr $n + 1`
echo "mv $filen.$n $filen.$p"
mv $filen.$n $filen.$p
fi
done
# rename the original file&:
if [ -f "$filen" ]; then
echo "mv $filen $filen.1"
mv $filen $filen.1
fi
echo touch $filen
touch $filen
這個指令碼是如何工作的呢?在檢測使用者提供了一個檔案名稱以後,我們進行一個9到1的迴圈。檔案9被命名為10,檔案8重新命名為9等等。迴圈完成之後,我們將原始檔案命名為檔案1同時建立一個與原始檔案同名的空檔案。
調試
最簡單的調試命令當然是使用echo命令。您可以使用echo在任何懷疑出錯的地方列印任何變數值。這也是絕大多數的shell程式員要花費80%的時間來偵錯工具的原因。Shell程式的好處在於不需要重新編譯,插入一個echo命令也不需要多少時間。
shell也有一個真實的偵錯模式。如果在指令碼"strangescript" 中有錯誤,您可以這樣來進行調試:
sh -x strangescript
這將執行該指令碼並顯示所有變數的值。
shell還有一個不需要執行指令碼只是檢查文法的模式。可以這樣使用:
sh -n your_script
這將返回所有語法錯誤。
我們希望您現在可以開始寫您自己的shell指令碼,希望您玩得開心。