標籤:
學習撰寫 script 最迅速的捷徑是觀摩別人的 script 檔案。不過,此法儘管實際,但這對於 shell 基礎認知不足的人來說,通常都得到"事倍功半",甚至半途而廢。通常第一個問題就是搞不懂那些"特殊符號"到底在代表什麼意義,又到底她們幹了些什麼?
以下,農夫嘗試列出常用的特殊符號表列,並在說明中加入簡短的範例。原則上,"詳細介紹"實非本章寫作的原意。因為這些符號,在我後面打算撰寫的章節,可能會再次出現。因此本章僅是表列性質。
# ; ;; . , / \ ‘string‘
| ! $ ${} $? $$ $* "string"
* ** ? : ^ $# [email protected] `command`
{} [] [[]] () (()) || && {xx,yy,zz,...}
~ ~+ ~- & \<...\> + - %
= == !=
輸出/輸入重導向
> >> < << : > &> 2&> 2<>
>& >&2
不管如何,對任何人而言,想更進一步掌握這些符號的定義,最好的參考資料還是線上說明。而主動學習永遠是最好的途徑之一。至於深入理解與運用,是你自己的努力。
# 井號 (comments)
這幾乎是個滿場都有的符號,除了先前已經提過的"第一行"
#!/bin/bash
井號也常出現在一行的開頭,或者位於完整指令之後,這類情況表示符號後面的是註解文字,不會被執行。
# This line is comments.
echo "a = $a" # a = 0
由於這個特性,當臨時不想執行某行指令時,只需在該行開頭加上 # 就行了。這常用在撰寫過程中。
#echo "a = $a" # a = 0
如果她被用在指令中,或者引號雙引號括住的話,或者在倒斜線的後面,那他就變成一般符號,不具上述的特殊功能。
~ 帳戶的 home 目錄
算是個常見的符號,代表使用者的 home 目錄。
cd ~
也可以直接在符號後加上某帳戶的名稱
cd ~user
或者當成是路徑的一部份
~/bin
~+ 當前的工作目錄
這個符號代表當前的工作目錄,她和內建指令 pwd 的作用是相同的。
# echo ~+
/var/log
~- 上次的工作目錄
這個符號代表上次的工作目錄。
# echo ~-
/etc/httpd/logs
; 分號 (Command separator)
在 shell 中,擔任"連續指令"功能的符號就是"分號"。譬如以下的例子
cd ~/backup ; mkdir startup ; cp ~/.* startup/.
;; 連續分號 (Terminator)
專用在 case 的選項,擔任 Terminator 的角色。
case "$fop" in
help) echo "Usage: Command -help -version filename" ;;
version) echo "version 0.1" ;;
esac
. 逗號 (dot)
在 shell 中,使用者應該都清楚,一個 dot 代表目前的目錄,兩個 dot 代表上層目錄。
CDPATH=.:~:/home:/home/web:/var:/usr/local
在上行 CDPATH 的設定中,等號後的 dot 代表的就是目前的目錄的意思。
如果設定檔名稱以 dot 開頭,該檔案就屬特殊檔案,用 ls 指令必須加上 -a 選項才會顯示。
除此之外,在 regular expression 中,一個 dot 代表匹配一個字元。
‘string‘ 單引號 (single quote)
被單引號用括住的內容,將被視為單一字串。在引號內的代表變數的 $ 符號,沒有作用,也就是說,他被視為一般符號處理。
heyyou=home
echo ‘$heyyou‘ # We get $heyyou
"string" 雙引號 (double quote)
被雙引號用括住的內容,將被視為單一字串。在引號內的代表變數的 $ 符號,仍舊可以代入變數內容。這點與單引數的處理方式不同。
heyyou=home
echo "$heyyou" # We get home
`command` 倒引號 (backticks)
在前面的單雙引號,括住的是字串,但如果該字串是一列命令列,會怎樣?答案是不會執行。要處理這種情況,我們得用倒單引號來做。
fdv=`date +%F`
echo "Today $fdv"
在倒引號內的 date +%F 會被視為指令,執行的結果會帶入 fdv 變數中。
, 逗點 (comma)
這個符號常運用在運算當中當做"區隔"用途。如下例
#!/bin/bash
let "t1 = ((a = 5 + 3, b = 7 - 1, c = 15 / 3))"
echo "t1 = $t1, a = $a, b = $b"
/ 斜線 (forward slash)
在路徑表示時,她代表目錄。
cd /etc/rc.d
cd ../..
cd /
通常單一的 / 代表 root 根目錄的意思。這相當常用,也應該很容易理解。此外,她也在四則運算中,代表除法的符號。
let "num1 = ((a = 10 / 2, b = 25 / 5))"
\ 倒斜線 (escape)
在交談模式下的 escape 字元,有幾個作用;放在指令前,有取消 aliases 的作用;放在特殊符號前,則該特殊符號的作用消失;放在指令的最末端,表示指令串連下一行。
# type rm
rm is aliased to `rm -i‘
# \rm ./*.log
上例,我在 rm 指令前加上 escape 字元,作用是暫時取消別名的功能,將 rm 指令還原。
# bkdir=/home
# echo "Backup dir, \$bkdir = $bkdir"
Backup dir, $bkdir = /home
上例 echo 內的 \$bkdir,escape 將 $ 變數的功能取消了,因此,會輸出 $bkdir,而第二個 $bkdir 則會輸出變數的內容 /home。
| 管線 (pipeline)
pipeline 是 UNIX 系統,基礎且重要的觀念。連結上個指令的標準輸出,做為下個指令的標準輸入。
who | wc -l
善用這個觀念,對精簡 script 有相當的協助。
! 驚嘆號(negate or reverse)
通常它代表反邏輯的作用,譬如條件偵測中,用 != 來代表"不等於"
if [ "$?" != 0 ]
then
echo "Executes error"
exit 1
fi
還有,在 Regular Expressions 中她擔任 "反邏輯" 的角色
ls a[!0-9]
上例,代表排除顯示 a0, a1 .... a9 這幾個檔案。
: 冒號
在 bash 中,人稱露二點的冒號,是個道地的內建指令。她負責執行一件很偉大的事,就是"什麼事都不幹",但回應狀態值 0。
:
echo $? # 回應為 0
來看個應用她的例子
: > f.$$
上面這一行,相當於 cat /dev/null > f.$$。不僅寫法簡短了,而且執行效率也好上許多。
有時,也會出現以下這類的用法
: ${HOSTNAME?} ${USER?} ${MAIL?}
這行的作用是,檢查這些環境變數是否已宣告,沒有宣告的將會以標準錯誤顯示錯誤訊息。像這種檢查如果使用類似 test 或 if 這類的做法,基本上也可以處理。但都比不上,上例的簡潔與效率。
除了上述之外,還有一個地方必須使用冒號
PATH=$PATH:$HOME/fbin:$HOME/fperl:/usr/local/mozilla
在使用者自己的 HOME 目錄下的 .bash_profile 或任何功能相似的檔案中,設定關於 "路徑" 變數的場合中,我們都使用冒號,來做區隔。這是她在 bash 中,另一個常被使用的場合。
? 問號 (wild card)
她在檔名擴充(Filename expansion)上扮演的角色是匹配一個任意的字元,但不包含 null 字元。
# ls a?
a1
善用她的特點,可以做比較精確的檔名匹配。
* 星號 (wild card)
相當常用的符號。在檔名擴充(Filename expansion)上,她用來代表任何字元,包含 null 字元。我個人喜歡叫他 - 星哥。
# ls a*
a a1 access_log
在運算時,它則代表 "乘法"。
let "fmult=2*3"
抱歉,例子簡單的有點過分了,請原諒我的電腦,她算數不好。除了內建指令 let,還有一個關於運算的指令 expr,星號在這裡也擔任"乘法"的角色。不過在使用上得小心,他的前面必須加上 escape 字元。
** 次方運算
兩個星號在運算時代表 "次方" 的意思。
let "sus=2**3"
echo "sus = $sus" # sus = 8
這玩意,農夫打從知道以來還不曾用過,換句話說叫 "白知"。
$ 錢號(dollar sign)
基本上,她對我來說永遠代表"美元"的意思。如果你上街問人....相信沒有會告訴你以下的兩種答案(如果有,我頭給你)。
她是變數替換(Variable Substitution)的代表符號。關於這個,在此之前,其實以經用過許多回了。
vrs=123
echo "vrs = $vrs" # vrs = 123
另外,她在 Regular Expressions 裡被定義為 "行" 的最末端 (end-of-line)。這個常用在 grep、sed、awk 以及 vim(vi) 當中。
${} 變數的 Parameter Expansion
bash 對 ${} 定義了不少用法。以下是取自線上說明的表列
${parameter:-word}
${parameter:=word}
${parameter:?word}
${parameter:+word}
${parameter:offset}
${parameter:offset:length}
${!prefix*}
${#parameter}
${parameter#word}
${parameter##word}
${parameter%word}
${parameter%%word}
${parameter/pattern/string}
${parameter//pattern/string}
這....,是個不小的課題。日後擇文說明。
$*
引用 script 的執行引數,是常有的。引數的演算法與一般指令相同,指令本身為引數 0,其後為引數 1,然後依此類推。引用變數的代表方式如下
$0, $1, $2, $3, $4, $5, $6, $7, $8, $9, ${10}, ${11}.....
個位元的引數,可直接使用數字,但兩位元以上,則必須使用 {} 符號來括住。
$* 則是代表所有引數的符號。使用時,得視情況加上雙引號。
echo "$*"
還有一個與 $* 具有相同作用的符號,但效用與處理方式略為不同的符號。
[email protected]
[email protected] 與 $* 具有相同作用的符號,不過她們兩者有一個不同點。
符號 $* 將所有的引數視為一個整體。但符號 [email protected] 則仍舊保留每個引數的區段觀念。讓我們用 for loop 分別處理這兩個符號,就能清楚一些。
# cat arg-02
#!/bin/bash
index=1
# About $*
echo -e "\nListing args with \"\$*\":"
for arg in "$*"
do
echo "Arg #$index = $arg"
let "index+=1"
done
echo -e "Entire arg list seen as single word.\n\n"
index=1
# About [email protected]
echo "Listing args with \"\[email protected]\":"
for arg in "[email protected]"
do
echo "Arg #$index = $arg"
let "index+=1"
done
echo "Arg list seen as separate words."
#
下面是執行結果
# ./arg-02 a b c d e f g h i j k
Listing args with "$*":
Arg # = a b c d e f g h i j k
Entire arg list seen as single word.
Listing args with "[email protected]":
Arg #1 = a
Arg #2 = b
Arg #3 = c
Arg #4 = d
Arg #5 = e
Arg #6 = f
Arg #7 = g
Arg #8 = h
Arg #9 = i
Arg #10 = j
Arg #11 = k
Arg list seen as separate words.
#
有興趣不妨自己處理看看她們的區別。
$#
這也是與引數相關的符號,她的作用是告訴你,引數的總數量是多少。
echo "$#"
$? 狀態值 (status variable)
一般來說,UNIX(linux) 系統的 process 以執行 system call exit() 來作為終結的。這個回傳值就是 status 值。她回傳給 parent process,作為檢查 child process 執行狀態使用。
一般指令程式倘若執行成功,其回傳值為 0;失敗為 1。這在撰寫 script 時,使用的相當頻繁。
tar cvfz dfbackup.tar.gz /home/user > /dev/null
echo "$?"
$$
前面曾經簡單地提到程式的執行,這個符號與程式有關。由於程式的 ID 是唯一的,所以在同一個時間,不可能有重複性的 PID。先理解此點。
有時,撰寫 script 會需要產生暫態檔案,用來存放必要的資料。而此 script 亦有可能在同一時間被使用者們同時使用。在這種情況下,固定檔名的暫態檔,在寫法上就顯的不可靠,也不可行。唯有產生動態檔名,才能符合需要。但如何做??
符號 $$ 或許可以符合這種需求。它代表當前 shell 的 PID。
echo "$HOSTNAME, $USER, $MAIL" > ftmp.$$
使用它來作為檔名的一部份,可以避免在同一時間,產生同檔名的覆蓋現象。
ps: 基本上,系統會回收執行完畢的 PID,然後再次依需要分配使用。所以 script 即使暫存檔是使用動態檔名的寫法,如果 script 執行完畢後仍不加以清除,會衍生其他問題。此點也必須注意。
() 指令群組 (command group)
用括弧將一串聯續指令括起來,這種用法對 shell 來說,稱為指令群組。如下面的例子
(cd ~ ; vcgh=`pwd` ; echo $vcgh)
指令群組有一個特性,shell會以產生 subshell 來執行這組指令。因此,在其中所定義的變數,僅作用於指令群組本身。我們來看個例子
# cat ftmp-01
#!/bin/bash
a=fsh
(a=incg ; echo -e "\n $a \n")
echo $a
# ./ftmp-01
incg
fsh
除了上述的指令群組,括弧也用在 array 變數的定義上;另外也應用在其他可能需要加上 escape 字元才能運作的場合,如運算式。這些我就不在舉例了,後續的章節中會再次提到。
(())
這組符號的作用與 let 指令相似,用在算數運算上。只不過她是 bash 的內建功能。所以,在執行效率上會比使用 let 指令要好許多。
#!/bin/bash
(( a = 10 ))
echo -e "inital value, a = $a\n"
(( a++ ))
echo "after a++, a = $a"
{} 大括弧 (Block of code)
有時候 script 當中會出現,大括弧中會夾著一段或幾段以"分號"做結尾的指令或變數設定。
# cat ftmp-02
#!/bin/bash
a=fsh
{a=inbc ; echo -e "\n $a \n"}
echo $a
# ./ftmp-02
inbc
inbc
這種用法與上面介紹的指令群組非常相似,但有個不同點,她在當前的 shell 執行,不會產生 subshell。
大括弧也被運用在 "函數" 的功能上。廣義地說,單純只使用大括弧時,作用就像是個沒有指定名稱的函數一般。因此,善用她來撰寫 script 也是相當好的一件事。尤其對輸出輸入的重導向上,這個做法可精簡 script 的複雜度。
此外,大括弧還有另一種用法,如下
{xx,yy,zz,...}
這種大括弧的組合,常用在字串的組合上,來看個例子
mkdir {userA,userB,userC}-{home,bin,data}
我們得到 userA-home, userA-bin, userA-data, userB-home, userB-bin, userB-data, userC-home, userC-bin, userC-data,這幾個目錄。這組符號在適用性上相當廣泛。能加以善用的話,回報是精簡與效率。像下面的例子
chown root /usr/{ucb/{ex,edit},lib/{ex?.?*,how_ex}}
如果不是因為支援這種用法,我們得寫幾行重複幾次呀!
[] 中括弧
她常出現在流程式控制制中,扮演括住判斷式的作用。抱歉!回鍋個例子
if [ "$?" != 0 ]
then
echo "Executes error"
exit 1
fi
這個符號在 Regular Expressions 中擔任類似 "範圍" 或 "集合" 的角色
rm -r 200[1234]
上例,代表刪除 2001, 2002, 2003, 2004 等目錄的意思。
除此之外,她也有個"雙層漢堡"的用法
[[]]
這組符號與先前的 [] 符號,基本上作用相同,但她允許在其中直接使用 || 與 && 邏輯等符號。
#!/bin/bash
read ak
if [[ $ak > 5 || $ak < 9 ]]
then
echo $ak
fi
|| 邏輯符號
這個會時常看到,代表 or 邏輯的符號。
&& 邏輯符號
這個也會常看到,代表 and 邏輯的符號。
& 背景工作
單一個 & 符號,且放在完整指令列的最後端,即表示將該指令列放入背景中工作。
tar cvfz data.tar.gz data > /dev/null &
\<...\> 單字邊界
這組符號在 Regular Expressions 中,被定義為"邊界"的意思。譬如,當我們想找尋 the 這個單字時,如果我們用
grep the FileA
你將會發現,像 there 這類的單字,也會被當成是匹配的單字。因為 the 正巧是 there 的一部份。如果我們要必免這種情況,就得加上 "邊界" 的符號
grep ‘\‘ FileA
這就是她的作用。
+ 加號 (plus)
在運算式中,她用來表示 "加法"。
expr 1 + 2 + 3
這個應該沒有問題。此外她也在 Regular Expressions 中,用來表示"很多個"的前面字元的意思。
# grep ‘10\+9‘ fileB
109
1009
100009
1000093
1010009
#
這個符號在使用時,前面必須加上 escape 字元。
- 減號 (dash)
在運算式中,她用來表示 "減法"。
expr 10 - 2
此外也是系統指令的選項符號。
ls -expr 10 - 2
在 GNU 指令中,如果單獨使用 - 符號,不加任何該加的設定檔名稱時,她便代表"標準輸入"的意思。這是 GNU 指令的共通選項。譬如下例
tar xpvf -
這裡的 - 符號,既代表從標準輸入讀取資料。
不過,她在 cd 指令中則比較特別
cd -
這代表變更工作目錄到"上一次"工作目錄。
% 除法 (Modulo)
在運算式中,她用來表示 "除法"。
expr 10 % 2
此外,她也被運用在關於變數的 Parameter Expansion 當中的下列
${parameter%word}
${parameter%%word}
一個 % 表示最短的 word 匹配,兩個表示最長的 word 匹配。這個項目以後會再詳細介紹。
= 等號 (Equals)
常在設定變數時看到的符號。
vara=123
echo " vara = $vara"
或者像是 PATH 的設定,甚至應用在運算或判斷式等此類用途上。
== 等號 (Equals)
常在條件判斷式中看到,代表 "等於" 的意思。
if [ $vara == $varb ]
...下略
!= 不等於
常在條件判斷式中看到,代表 "不等於" 的意思。
if [ $vara != $varb ]
...下略
^
這個符號在 regular expression 中,代表行的 "開頭" 位置。
輸出/輸入重導向
關於 "輸出/輸入重導向" 的符號,不僅是常用,同時也是非常重要的基礎。
>, >>, <, <<
這四個兄弟,大概不須多講
: >, &>, 2&>, >&, >&2, 2<>
這掛兄弟其實也蠻常用的,在此不再贅述。
shell中的特殊符號