shell編程基礎(轉自UBUNTU論壇)
(2008-11-05 12:49:20)
轉載
http://wiki.ubuntu.org.cn/Shell%E7%BC%96%E7%A8%8B%E5%9F%BA%E7%A1%80
為什麼要進行shell編程
Linux系統中雖然有各種各樣的圖形介面工具,但shell仍然是一個非常靈活的工具。Shell不僅集合了大量命令,還是一門非常棒的程式設計語言。藉助shell,大量任務能實現自動化;shell特別擅長系統管理任務,尤其適合那些易用性、可維護性和便攜性比效率更重要的任務。
下面,讓我們一起來看看shell是如何工作的:
建立一個指令碼
Linux中有許多種不同的shell,通常我們使用bash (bourne again shell) 進行shell編程,因為bash不僅免費(自由)且便於使用。本文提供的指令碼都用bash(當然大多數情況下,這些指令碼同樣可以在bash的前輩,bourne shell中運行)執行。
如同其他語言一樣,我們可以使用任意一種文字編輯器,比如nedit、kedit、emacs、vi等來編寫shell指令碼,它必須以如下行開始(必須放在檔案的第一行):
代碼:
#!/bin/sh
符號#!用來告訴系統執行該指令碼的程式,本例使用/bin/sh。編輯完了,如果要執行該指令碼,還必須使其可執行:
代碼:
chmod +x filename
這樣輸入 ./filename 便可執行該指令碼。
注釋
shell指令碼中以# 開始的行表示注釋,直到一行的結束。我們真誠的建議你在指令碼中使用注釋,這樣即便在相當長時間內沒有使用該指令碼,你也能在短時間內明白該指令碼的作用和工作原理;此外還有很重要的原因——有了注釋,更利於和別人分享你的指令碼。
變數
在其它程式設計語言中,你必須使用變數。shell編程中,所有變數都由字串組成,並且不需要聲明。要給一個變數賦值,你可以這麼寫:
代碼:
變數名=值
在變數名之前加一個$,就可以取出變數值:
代碼:
#!/bin/sh
#對變數賦值:
a="hello world"
# 列印變數a的值:
echo "A is:" $a
挑個自己喜歡的編輯器,輸入以上內容,並儲存為檔案first,然後執行 chmod +x first 使其可執行,最後輸入 ./first 執行該指令碼。其輸出結果如下:
引用:
A is: hello world
有時候變數名可能會和其它文字混淆,比如:
代碼:
num=2
echo "this is the $numnd"
上述指令碼並不會輸出"this is the 2nd",只會列印"this is the ";這是由於shell會去搜尋變數numnd的值,而實際上這個變數此時並沒有值。可以使用花括弧來告訴shell我們要列印的是num變數:
代碼:
num=2
echo "this is the ${num}nd"
上述指令碼的輸出結果為: this is the 2nd
有許多變數是系統自動設定的,在後面用到這些變數時我們再作說明。如果你需要處理數學運算式,那麼得藉助諸如 expr 的程式。
除了僅在指令碼內有效普通shell變數外,還有環境變數,即那些由export關鍵字處理過的變數。本文不討論環境變數,因為一般只在登入指令檔中使用環境變數。
Shell命令和流程式控制制
在shell指令碼中可以使用三類命令:
1) Unix 命令:
在shell指令碼中可以使用任意unix命令,不過實際上最為常用的通常是那些檔案和文字操作相關的命令。下面介紹一些常用命令文法及功能:
echo "some text": 在螢幕上輸出資訊
ls: 檔案清單
wc –l file wc -w file wc -c file: 分別計算檔案的行數(line)、單詞數(word)和字元數(character)
cp sourcefile destfile: 檔案拷貝
mv oldname newname : 重新命名檔案或移動檔案
rm file: 刪除檔案
grep 'pattern' file: 在檔案內搜尋字串或和Regex匹配的字串
cut -b column file: 將指定範圍內的檔案內容輸出到標準輸出裝置(螢幕)上。比如:輸出每行第5至9個字元 cut -b5-9 file.txt,注意不要和cat命令混淆,這是兩個完全不同的命令
cat file.txt: 輸出檔案內容到標準輸出裝置(螢幕)上
file somefile: 取得檔案somefile的檔案類型
read var: 提示使用者輸入,並將輸入內容賦值給變數var
sort file.txt: 對file.txt檔案所有行進行排序
uniq: 只輸出檔案中內容不一致的行,如: sort file.txt | uniq
expr: 進行數學運算,如要進行2+3的運算,命令為: expr 2 "+" 3
find: 搜尋檔案,如根據檔案名稱搜尋:find . -name filename -print
tee: 將資料輸出到標準輸出裝置(螢幕) 和檔案,比如:somecommand | tee outfile
basename file: 返回不包含路徑的檔案名稱,如: basename /bin/tux 會返回 tux
dirname file: 返迴文件所在路徑,如:dirname /bin/tux 會返回 /bin
head file: 列印文字檔開頭幾行
tail file : 列印文字檔末尾幾行
sed: Sed是一個基本的尋找替換程式。可以從標準輸入(如命令管道)讀入文本,並將結果輸出到標準輸出(螢幕);該命令採用Regex進行搜尋。不要和shell中的萬用字元相混淆。比如將 ubuntu 替換為 Ubuntu :cat text.file | sed 's/ubuntu/Ubuntu/' > newtext.file
awk: awk 用來提取文字檔中的欄位。預設的欄位分割符是空格,可以使用 -F 指定其它分割符。cat file.txt | awk -F, '{print $1 "," $3 }',這裡我們使用 , 作為欄位分割符,同時列印第一和第三個欄位。如果該檔案內容為 Adam Bor, 34, IndiaKerry Miller, 22, USA,則上述命令的輸出為:Adam Bor, IndiaKerry Miller, USA
2) 概念: 管道, 重新導向和 backtick
儘管這些都不是系統命令,不過它們扮演著相當重要的角色。
管道 (|) 將一個命令的輸出作為另外一個命令的輸入。
代碼:
grep "hello" file.txt | wc -l
上述命令會在file.txt中搜尋包含有”hello”的行並計算行數,這裡grep命令的輸出成了wc命令的輸入。當然您可以使用多個命令。
重新導向:將命令的結果輸出到檔案,而不是標準輸出(螢幕)。
代碼:
> 寫入檔案並覆蓋舊檔案
>> 加到檔案的尾部,保留舊檔案內容。
反短斜線
使用反短斜線可以將一個命令的輸出作為另外一個命令的一個命令列參數。
代碼:
find . -mtime -1 -type f -print
上述命令可以尋找過去24小時(-mtime –2則表示過去48小時)內修改過的檔案。如果你想將所有尋找到的檔案打一個包,則可以使用以下指令碼:
代碼:
#!/bin/sh
# The ticks are backticks (`) not normal quotes ('):
tar -zcvf lastmod.tar.gz `find . -mtime -1 -type f -print`
3) 流程式控制制
"if" 運算式如果條件為真則執行then後的部分:
代碼:
if ....; then
....
elif ....; then
....
else
....
fi
大多數情況下,可以使用測試命令來對條件進行測試。比如可以比較字串、判斷檔案是否存在及是否可讀等等…通常用" [ ] "來表示條件測試,注意這裡的空格很重要,要確保方括弧前後的空格。
代碼:
[ -f "somefile" ] :判斷是否是一個檔案
[ -x "/bin/ls" ] :判斷/bin/ls是否存在並有可執行許可權
[ -n "$var" ] :判斷$var變數是否有值
[ "$a" = "$b" ] :判斷$a和$b是否相等
執行man test可以查看所有測試運算式可以比較和判斷的類型。
直接執行以下指令碼:
代碼:
#!/bin/sh
if [ "$SHELL" = "/bin/bash" ]; then
echo "your login shell is the bash (bourne again shell)"
else
echo "your login shell is not bash but $SHELL"
fi
變數$SHELL包含了登入shell的名稱,我們拿它和/bin/bash進行比較。
快捷操作符
熟悉C語言的朋友可能會很喜歡下面的運算式:
代碼:
[ -f "/etc/shadow" ] && echo "This computer uses shadow passwors"
這裡的 && 就是一個快捷操作符,如果左邊的運算式為真則執行右邊的語句。你也可以把它看作邏輯運算的與操作。上述指令碼表示如果/etc/shadow檔案存在,則列印” This computer uses shadow passwors”。同樣或操作(||)在shell編程中也可以用,例如:
代碼:
#!/bin/sh
mailfolder=/var/spool/mail/james
[ -r "$mailfolder" ] || { echo "Can not read $mailfolder" ; exit 1; }
echo "$mailfolder has mail from:"
grep "^From " $mailfolder
該指令碼首先判斷mailfolder是否可讀,如果可讀則列印該檔案中的"From" 一行。如果不可讀則或操作生效,列印錯誤資訊後指令碼退出。這裡有個問題,那就是我們必須有兩個命令:
-列印錯誤資訊
-退出程式
我們使用花括弧以匿名函數的形式將兩個命令放到一起作為一個命令使用。一般函數將在下文提及。不用與和或操作符,我們也可以用if運算式作任何事情,但是使用與或操作符會更便利很多。
case運算式可以用來匹配一個給定的字串,而不是數字。
代碼:
case ... in
...) do something here ;;
esac
讓我們看一個例子,file命令可以辨別出一個給定檔案的檔案類型,如:file lf.gz,該命令輸出結果為:
引用:
lf.gz: gzip compressed data, deflated, original filename,
last modified: Mon Aug 27 23:09:18 2001, os: Unix
我們利用這一點寫了一個叫做smartzip的指令碼,該指令碼可以自動解壓bzip2, gzip 和zip 類型的壓縮檔:
#!/bin/sh
ftype=`file "$1"`
case "$ftype" in
"$1: Zip archive"*)
unzip "$1" ;;
"$1: gzip compressed"*)
gunzip "$1" ;;
"$1: bzip2 compressed"*)
bunzip2 "$1" ;;
*) error "File $1 can not be uncompressed with smartzip";;
esac
您可能注意到我們在這裡使用了一個特殊的變數$1。該變數包含了傳遞給該程式的第一個參數值。也就是說,當我們運行:
smartzip articles.zip
$1 就是字串 articles.zip
select 運算式是一種bash的擴充應用,尤其擅長於互動式使用。使用者可以從一組不同的值中進行選擇。
select var in ... ; do
break
done
.... now $var can be used ....
下面是一個例子:
#!/bin/sh
echo "What is your favourite OS?"
select var in "Linux" "Gnu Hurd" "Free BSD" "Other"; do
break
done
echo "You have selected $var"
下面是該指令碼啟動並執行結果:
What is your favourite OS?
1) Linux
2) Gnu Hurd
3) Free BSD
4) Other
#? 1
You have selected Linux
您也可以在shell中使用如下的loop運算式:
while ...; do
....
done
while-loop 將運行直到運算式測試為真。will run while the expression that we test for is true. 關鍵字"break" 用來跳出迴圈。而關鍵字”continue”用來不執行餘下的部分而直接跳到下一個迴圈。
for-loop運算式查看一個字串列表 (字串用空格分隔) 然後將其賦給一個變數:
for var in ....; do
....
done
在下面的例子中,將分別列印ABC到螢幕上:
#!/bin/sh
for var in A B C ; do
echo "var is $var"
done
下面是一個更為有用的指令碼showrpm,其功能是列印一些RPM包的統計資訊:
#!/bin/sh
# list a content summary of a number of RPM packages
# USAGE: showrpm rpmfile1 rpmfile2 ...
# EXAMPLE: showrpm /cdrom/RedHat/RPMS/*.rpm
for rpmpackage in $*; do
if [ -r "$rpmpackage" ];then
echo "=============== $rpmpackage =============="
rpm -qi -p $rpmpackage
else
echo "ERROR: cannot read file $rpmpackage"
fi
done
這裡出現了第二個特殊的變數$*,該變數包含了所有輸入的命令列參數值。如果您運行showrpm openssh.rpm w3m.rpm webgrep.rpm
此時 $* 包含了 3 個字串,即openssh.rpm, w3m.rpm and webgrep.rpm.
引號
在向程式傳遞任何參數之前,程式會擴充萬用字元和變數。這裡所謂擴充的意思是程式會把萬用字元(比如*)替換成合適的檔案名稱,它變數替換成變數值。為了防止程式作這種替換,您可以使用引號:讓我們來看一個例子,假設在目前的目錄下有一些檔案,兩個jpg檔案, mail.jpg 和tux.jpg。
#!/bin/sh
echo *.jpg
這將列印出"mail.jpg tux.jpg"的結果。
引號 (單引號和雙引號) 將防止這種萬用字元擴充:
#!/bin/sh
echo "*.jpg"
echo '*.jpg'
這將列印"*.jpg" 兩次。
單引號更嚴格一些。它可以防止任何變數擴充。雙引號可以防止萬用字元擴充但允許變數擴充。
#!/bin/sh
echo $SHELL
echo "$SHELL"
echo '$SHELL'
運行結果為:
/bin/bash
/bin/bash
$SHELL
最後,還有一種防止這種擴充的方法,那就是使用逸出字元——反斜杆:
echo *.jpg
echo $SHELL
這將輸出:
*.jpg
$SHELL
Here documents
當要將幾行文字傳遞給一個命令時,here documents(譯者註:目前還沒有見到過對該詞適合的翻譯)一種不錯的方法。對每個指令碼寫一段協助性的文字是很有用的,此時如果我們四有那個 here documents就不必用echo函數一行行輸出。 一個 "Here document" 以 << 開頭,後面接上一個字串,這個字串還必須出現在here document的末尾。下面是一個例子,在該例子中,我們對多個檔案進行重新命名,並且使用here documents列印協助:
#!/bin/sh
# we have less than 3 arguments. Print the help text:
if [ $# -lt 3 ] ; then
cat < ren -- renames a number of files using sed regular expressions
USAGE: ren 'regexp' 'replacement' files...
EXAMPLE: rename all *.HTM files in *.html:
ren 'HTM$' 'html' *.HTM
HELP
exit 0
fi
OLD="$1"
NEW="$2"
# The shift command removes one argument from the list of
# command line arguments.
shift
shift
# $* contains now all the files:
for file in $*; do
if [ -f "$file" ] ; then
newfile=`echo "$file" | sed "s/${OLD}/${NEW}/g"`
if [ -f "$newfile" ]; then
echo "ERROR: $newfile exists already"
else
echo "renaming $file to $newfile ..."
mv "$file" "$newfile"
fi
fi
done
這是一個複雜一些的例子。讓我們詳細討論一下。第一個if運算式判斷輸入命令列參數是否小於3個 (特殊變數$# 表示包含參數的個數) 。如果輸入參數小於3個,則將協助文字傳遞給cat命令,然後由cat命令將其列印在螢幕上。列印協助文字後程式退出。如果輸入參數等於或大於3個,我們就將第一個參數賦值給變數OLD,第二個參數賦值給變數NEW。下一步,我們使用shift命令將第一個和第二個參數從參數列表中刪除,這樣原來的第三個參數就成為參數列表$*的第一個參數。然後我們開始迴圈,命令列參數列表被一個接一個地被賦值給變數$file。接著我們判斷該檔案是否存在,如果存在則通過sed命令搜尋和替換來產生新的檔案名稱。然後將反短斜線內命令結果賦值給newfile。這樣我們就達到了我們的目的:得到了舊檔案名稱和新檔案名稱。然後使用mv命令進行重新命名。
函數
如果您寫了一些稍微複雜一些的程式,您就會發現在程式中可能在幾個地方使用了相同的代碼,並且您也會發現,如果我們使用了函數,會方便很多。一個函數是這個樣子的:
functionname()
{
# inside the body $1 is the first argument given to the function
# $2 the second ...
body
}
您需要在每個程式的開始對函數進行聲明。
下面是一個叫做xtitlebar的指令碼,使用這個指令碼您可以改變終端視窗的名稱。這裡使用了一個叫做help的函數。正如您可以看到的那樣,這個定義的函數被使用了兩次。
#!/bin/sh
# vim: set sw=4 ts=4 et:
help()
{
cat < xtitlebar -- change the name of an xterm, gnome-terminal or kde konsole
USAGE: xtitlebar [-h] "string_for_titelbar"
OPTIONS: -h help text
EXAMPLE: xtitlebar "cvs"
HELP
exit 0
}
# in case of error or if -h is given we call the function help:
[ -z "$1" ] && help
[ "$1" = "-h" ] && help
# send the escape sequence to change the xterm titelbar:
echo -e "33]0;$107"
#
在指令碼中提供協助是一種很好的編程習慣,這樣方便其他使用者(和您)使用和理解指令碼。
命令列參數
我們已經見過$* 和 $1, $2 ... $9 等特殊變數,這些特殊變數包含了使用者從命令列輸入的參數。迄今為止,我們僅僅瞭解了一些簡單的命令列文法(比如一些強制性的參數和查看協助的-h選項)。但是在編寫更複雜的程式時,您可能會發現您需要更多的自訂的選項。通常的慣例是在所有可選的參數之前加一個減號,後面再加上參數值 (比如檔案名稱)。
有好多方法可以實現對輸入參數的分析,但是下面的使用case運算式的例子無遺是一個不錯的方法。
#!/bin/sh
help()
{
cat < This is a generic command line parser demo.
USAGE EXAMPLE: cmdparser -l hello -f -- -somefile1 somefile2
HELP
exit 0
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;; # function help is called
-f) opt_f=1;shift 1;; # variable opt_f is set
-l) opt_l=$2;shift 2;; # -l takes an argument -> shift by 2
--) shift;break;; # end of options
-*) echo "error: no such option $1. -h for help";exit 1;;
*) break;;
esac
done
echo "opt_f is $opt_f"
echo "opt_l is $opt_l"
echo "first arg is $1"
echo "2nd arg is $2"
您可以這樣運行該指令碼:
cmdparser -l hello -f -- -somefile1 somefile2
返回的結果是:
opt_f is 1
opt_l is hello
first arg is -somefile1
2nd arg is somefile2
這個指令碼是如何工作的呢?指令碼首先在所有輸入命令列參數中進行迴圈,將輸入參數與case運算式進行比較,如果匹配則設定一個變數並且移除該參數。根據unix系統的慣例,首先輸入的應該是包含減號的參數。
執行個體
一般編程步驟
現在我們來討論編寫一個指令碼的一般步驟。任何優秀的指令碼都應該具有協助和輸入參數。並且寫一個偽指令碼(framework.sh),該指令碼包含了大多數指令碼都需要的架構結構,是一個非常不錯的主意。這時候,在寫一個新的指令碼時我們只需要執行一下copy命令:
cp framework.sh myscript
然後再插入自己的函數。
讓我們再看兩個例子:
二進位到十進位的轉換
指令碼 b2d 將位元 (比如 1101) 轉換為相應的十進位數。這也是一個用expr命令進行數學運算的例子:
#!/bin/sh
# vim: set sw=4 ts=4 et:
help()
{
cat < b2h -- convert binary to decimal
USAGE: b2h [-h] binarynum
OPTIONS: -h help text
EXAMPLE: b2h 111010
will return 58
HELP
exit 0
}
error()
{
# print an error and exit
echo "$1"
exit 1
}
lastchar()
{
# return the last character of a string in $rval
if [ -z "$1" ]; then
# empty string
rval=""
return
fi
# wc puts some space behind the output this is why we need sed:
numofchar=`echo -n "$1" | wc -c | sed 's/ //g' `
# now cut out the last char
rval=`echo -n "$1" | cut -b $numofchar`
}
chop()
{
# remove the last character in string and return it in $rval
if [ -z "$1" ]; then
# empty string
rval=""
return
fi
# wc puts some space behind the output this is why we need sed:
numofchar=`echo -n "$1" | wc -c | sed 's/ //g' `
if [ "$numofchar" = "1" ]; then
# only one char in string
rval=""
return
fi
numofcharminus1=`expr $numofchar "-" 1`
# now cut all but the last char:
rval=`echo -n "$1" | cut -b 0-${numofcharminus1}`
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;; # function help is called
--) shift;break;; # end of options
-*) error "error: no such option $1. -h for help";;
*) break;;
esac
done
# The main program
sum=0
weight=1
# one arg must be given:
[ -z "$1" ] && help
binnum="$1"
binnumorig="$1"
while [ -n "$binnum" ]; do
lastchar "$binnum"
if [ "$rval" = "1" ]; then
sum=`expr "$weight" "+" "$sum"`
fi
# remove the last position in $binnum
chop "$binnum"
binnum="$rval"
weight=`expr "$weight" "*" 2`
done
echo "binary $binnumorig is decimal $sum"
#
該指令碼使用的演算法是利用十進位和位元權值 (1,2,4,8,16,..),比如二進位"10"可以這樣轉換成十進位:
0 * 1 + 1 * 2 = 2
為了得到單個的位元我們是用了lastchar 函數。該函數使用wc –c計算字元個數,然後使用cut命令取出末尾一個字元。Chop函數的功能則是移除最後一個字元。
檔案迴圈程式
或許您是想將所有發出的郵件儲存到一個檔案中的人們中的一員,但是在過了幾個月以後,這個檔案可能會變得很大以至於使對該檔案的訪問速度變慢。下面的指令碼rotatefile 可以解決這個問題。這個指令碼可以重新命名郵件儲存檔案(假設為outmail)為outmail.1,而對於outmail.1就變成了outmail.2 等等等等...
#!/bin/sh
# vim: set sw=4 ts=4 et:
ver="0.1"
help()
{
cat < rotatefile -- rotate the file name
USAGE: rotatefile [-h] filename
OPTIONS: -h help text
EXAMPLE: rotatefile out
This will e.g rename out.2 to out.3, out.1 to out.2, out to out.1
and create an empty out-file
The max number is 10
version $ver
HELP
exit 0
}
error()
{
echo "$1"
exit 1
}
while [ -n "$1" ]; do
case $1 in
-h) help;shift 1;;
--) break;;
-*) echo "error: no such option $1. -h for help";exit 1;;
*) break;;
esac
done
# input check:
if [ -z "$1" ] ; then
error "ERROR: you must specify a file, use -h for help"
fi
filen="$1"
# rename any .1 , .2 etc file:
for n in 9 8 7 6 5 4 3 2 1; do
if [ -f "$filen.$n" ]; then
p=`expr $n + 1`
echo "mv $filen.$n $filen.$p"
mv $filen.$n $filen.$p
fi
done
# rename the original file:
if [ -f "$filen" ]; then
echo "mv $filen $filen.1"
mv $filen $filen.1
fi
echo touch $filen
touch $filen
這個指令碼是如何工作的呢?在檢測使用者提供了一個檔案名稱以後,我們進行一個9到1的迴圈。檔案9被命名為10,檔案8重新命名為9等等。迴圈完成之後,我們將原始檔案命名為檔案1同時建立一個與原始檔案同名的空檔案。
調試
最簡單的調試命令當然是使用echo命令。您可以使用echo在任何懷疑出錯的地方列印任何變數值。這也是絕大多數的shell程式員要花費80%的時間來偵錯工具的原因。Shell程式的好處在於不需要重新編譯,插入一個echo命令也不需要多少時間。
shell也有一個真實的偵錯模式。如果在指令碼"strangescript" 中有錯誤,您可以這樣來進行調試:
sh -x strangescript
這將執行該指令碼並顯示所有變數的值。
shell還有一個不需要執行指令碼只是檢查文法的模式。可以這樣使用:
sh -n your_script
這將返回所有語法錯誤。