標籤:io ar color os 使用 sp for 檔案 on
shell字串的截取的問題:
一、Linux shell 截取字元變數的前8位,有方法如下:
1.expr substr “$a” 1 8
2.echo $a|awk ‘{print substr(,1,8)}’
3.echo $a|cut -c1-8
4.expr $a : ‘\(.\\).*’
5.echo $a|dd bs=1 count=8 2>/dev/null
二、按指定的字串截取
1、第一種方法: ${varible##*string} 從左向右截取最後一個string後的字串 ${varible#*string}從左向右截取第一個string後的字串 ${varible%%string*}從右向左截取最後一個string後的字串 ${varible%string*}從右向左截取第一個string後的字串 “*”只是一個萬用字元可以不要。
例子: $ MYVAR=foodforthought.jpg $ echo ${MYVAR##*fo} rthought.jpg $ echo ${MYVAR#*fo} odforthought.jpg
2、第二種方法:${varible:n1:n2}:截取變數varible從n1到n2之間的字串。
可以根據特定字元位移和長度,使用另一種形式的變數擴充,來選擇特定子字串。試著在 bash 中輸入以下行:
$ EXCLAIM=cowabunga $ echo ${EXCLAIM:0:3} cow $ echo ${EXCLAIM:3:7} abunga
這種形式的字串截斷非常簡便,只需用冒號分開來指定起始字元和子字串長度。
三、按照指定要求分割: 比如擷取尾碼名 ls -al | cut -d “.” -f2
一、構造字串
直接構造 STR_ZERO=hello STR_FIRST="i am a string" STR_SECOND=‘success‘
重複多次 #repeat the first parm($1) by $2 times strRepeat() { local x=$2 if [ "$x" == "" ]; then x=0 fi
local STR_TEMP="" while [ $x -ge 1 ]; do STR_TEMP=`printf "%s%s" "$STR_TEMP" "$1"` x=`expr $x - 1` done echo $STR_TEMP }
舉例: STR_REPEAT=`strRepeat "$USER_NAME" 3` echo "repeat = $STR_REPEAT"
二、賦值與拷貝
直接賦值 與構造字串一樣 USER_NAME=terry
從變數賦值 ALIASE_NAME=$USER_NAME
三、聯結
直接聯結兩個字串 STR_TEMP=`printf "%s%s" "$STR_ZERO" "$USER_NAME"` 使用printf可以進行更複雜的聯結
四、求長
求字元數(char) COUNT_CHAR=`echo "$STR_FIRST" | wc -m` echo $COUNT_CHAR
求位元組數(byte) COUNT_BYTE=`echo "$STR_FIRST" | wc -c` echo $COUNT_BYTE
求字數(word) COUNT_WORD=`echo "$STR_FIRST" | wc -w` echo $COUNT_WORD
五、比較
相等比較 str1 = str2
不等比較 str1 != str2
舉例: if [ "$USER_NAME" = "terry" ]; then echo "I am terry" fi
小於比較 #return 0 if the two string is equal, return 1 if $1 < $2, else 2strCompare() { local x=0 if [ "$1" != "$2" ]; then x=2 localTEMP=`printf "%s\n%s" "$1" "$2"` local TEMP2=`(echo "$1"; echo "$2") |sort` if [ "$TEMP" = "$TEMP2" ]; then x=1 fi fi echo $x }
六、測試
判空 -z str
判非空 -n str
是否為數字 # return 0 if the string is num, otherwise 1 strIsNum() { local RET=1 if [ -n "$1" ]; then local STR_TEMP=`echo "$1" | sed ‘s/[0-9]//g‘` if [ -z "$STR_TEMP" ]; then RET=0 fi fi echo $RET }
舉例: if [ -n "$USER_NAME" ]; then echo "my name is NOT empty" fi
echo `strIsNum "9980"`
七、分割
以符號+為準,將字元分割為左右兩部分 使用sed 舉例: 命令 date --rfc-3339 seconds 的輸出為 2007-04-14 15:09:47+08:00 取其+左邊的部分 date --rfc-3339 seconds | sed ‘s/+[0-9][0-9]:[0-9][0-9]//g‘ 輸出為 2007-04-14 15:09:47 取+右邊的部分 date --rfc-3339 seconds | sed ‘s/.*+//g‘ 輸出為 08:00
以空格為分割符的字串分割 使用awk 舉例: STR_FRUIT="Banana 0.89 100" 取第3欄位 echo $STR_FRUIT | awk ‘{ print $3; }‘
八、子字串
字串1是否為字串2的子字串 # return 0 is $1 is substring of $2, otherwise 1 strIsSubstring() { local x=1 case "$2" in *$1*) x=0;; esac echo $x }
在做shell批次程式時候,經常會涉及到字串相關操作。有很多命令語句,如:awk,sed都可以做字串各種操作。 其實shell內建一系列操作符號,可以達到類似效果,大家知道,使用內部操作符會省略啟動外部程式等時間,因此速度會非常的快。
一、判斷讀取字串值
運算式 |
含義 |
${var} |
變數var的值, 與$var相同 |
|
|
${var-DEFAULT} |
如果var沒有被聲明, 那麼就以$DEFAULT作為其值 * |
${var:-DEFAULT} |
如果var沒有被聲明, 或者其值為空白, 那麼就以$DEFAULT作為其值 * |
|
|
${var=DEFAULT} |
如果var沒有被聲明, 那麼就以$DEFAULT作為其值 * |
${var:=DEFAULT} |
如果var沒有被聲明, 或者其值為空白, 那麼就以$DEFAULT作為其值 * |
|
|
${var+OTHER} |
如果var聲明了, 那麼其值就是$OTHER, 否則就為null字串 |
${var:+OTHER} |
如果var被設定了, 那麼其值就是$OTHER, 否則就為null字串 |
|
|
${var?ERR_MSG} |
如果var沒被聲明, 那麼就列印$ERR_MSG * |
${var:?ERR_MSG} |
如果var沒被設定, 那麼就列印$ERR_MSG * |
|
|
${!varprefix*} |
匹配之前所有以varprefix開頭進行聲明的變數 |
${[email protected]} |
匹配之前所有以varprefix開頭進行聲明的變數 |
加入了“*” 不是意思是: 當然, 如果變數var已經被設定的話, 那麼其值就是$var.
[[email protected] ~]$ echo ${abc-‘ok‘} ok [[email protected] ~]$ echo $abc
[[email protected] ~]$ echo ${abc=‘ok‘} ok [[email protected] ~]$ echo $abc ok
如果abc 沒有聲明“=" 還會給abc賦值。
[[email protected] ~]$ var1=11;var2=12;var3= [[email protected] ~]$ echo ${[email protected]} var1 var2 var3 [[email protected] ~]$ echo ${!v*} var1 var2 var3
${!varprefix*}與${[email protected]}相似,可以通過變數名前置詞字元,搜尋已經定義的變數,無論是否為空白值。
二、字串操作(長度,讀取,替換)
運算式 |
含義 |
${#string} |
$string的長度 |
|
|
${string:position} |
在$string中, 從位置$position開始提取子串 |
${string:position:length} |
在$string中, 從位置$position開始提取長度為$length的子串 |
|
|
${string#substring} |
從變數$string的開頭, 刪除最短匹配$substring的子串 |
${string##substring} |
從變數$string的開頭, 刪除最長相符$substring的子串 |
${string%substring} |
從變數$string的結尾, 刪除最短匹配$substring的子串 |
${string%%substring} |
從變數$string的結尾, 刪除最長相符$substring的子串 |
|
|
${string/substring/replacement} |
使用$replacement, 來代替第一個匹配的$substring |
${string//substring/replacement} |
使用$replacement, 代替所有匹配的$substring |
${string/#substring/replacement} |
如果$string的首碼匹配$substring, 那麼就用$replacement來代替匹配到的$substring |
${string/%substring/replacement} |
如果$string的尾碼匹配$substring, 那麼就用$replacement來代替匹配到的$substring |
|
|
說明:"* $substring”可以是一個Regex.
1.長度
[[email protected] ~]$ test=‘I love china‘ [[email protected] ~]$ echo ${#test} 12
${#變數名}得到字串長度
2.截取字串
[[email protected] ~]$ test=‘I love china‘ [[email protected] ~]$ echo ${test:5} e china [[email protected] ~]$ echo ${test:5:10} e china
${變數名:起始:長度}得到子字串
3.字串刪除
[[email protected] ~]$ test=‘c:/windows/boot.ini‘ [[email protected] ~]$ echo ${test#/} c:/windows/boot.ini [[email protected] ~]$ echo ${test#*/} windows/boot.ini [[email protected] ~]$ echo ${test##*/} boot.ini
[[email protected] ~]$ echo ${test%/*} c:/windows [[email protected] ~]$ echo ${test%%/*}
${變數名#substringRegex}從字串開頭開始配備substring,刪除匹配上的運算式。
${變數名%substringRegex}從字串結尾開始配備substring,刪除匹配上的運算式。
注意:${test##*/},${test%/*} 分別是得到檔案名稱,或者目錄位址最簡單方法。
4.字串替換
[[email protected] ~]$ test=‘c:/windows/boot.ini‘ [[email protected] ~]$ echo ${test/\//\\} c:\windows/boot.ini [[email protected] ~]$ echo ${test//\//\\} c:\windows\boot.ini
${變數/尋找/替換值} 一個“/”表示替換第一個,”//”表示替換所有,當尋找中出現了:”/”請加轉義符”\/”表示。
三、效能比較
在shell中,通過awk,sed,expr 等都可以實現,字串上述操作。下面我們進行效能比較。
[[email protected] ~]$ test=‘c:/windows/boot.ini‘
[[email protected] ~]$ time for i in $(seq 10000);do a=${#test};done;
real 0m0.173s user 0m0.139s sys 0m0.004s
[[email protected] ~]$ time for i in $(seq 10000);do a=$(expr length $test);done;
real 0m9.734s user 0m1.628s
速度相差上百倍,調用外部命令處理,與內建操作符效能相差非常大。在shell編程中,盡量用內建操作符或者函數完成。使用awk,sed類似會出現這樣結果。
shell指令碼字串截取