tr(translate縮寫)主要用於刪除檔案中的控制字元,或進行字元轉換。
文法:tr [–c/d/s/t] [SET1] [SET2] #SET1: 字元集1;SET2:字元集2
-c:complement,用SET2替換除SET1以外的字元。
-d:delete,刪除SET1中所有的字元,不轉換。
-s:squeeze-repeats,壓縮SET1中重複的字元。
-t:truncate-set1,將SET1用SET2轉換,一般預設為-t。
1、去除重複的字元
#刪除空白行就是刪除分行符號/n。
#注意:這些空白行上只有斷行符號符,沒有空格符。
$ cat test.txt
I love linux!
Hello World!
Shell is worthy to been studied.
#這裡用分行符號的逸出字元\n.
#注意:此處用-s刪除了多餘的分行符號,如果用-d,則會刪除所有的分行符號.
$ cat test.txt | tr -s ["\n"]
I love linux!
Hello World!
Shell is worthy to been studied.
#也可以用八進位符\012,\012與\n都是分行符號。
$ cat test.txt | tr -s "[\012]"
I love linux!
Hello World!
Shell is worthy to been studied.
2、大小寫互換
# 將語句中所有的小寫字母變成大寫字母,其中-t可省略。
$ echo "Hello World I Love You" |tr [-t] [a-z] [A-Z]
HELLO WORLD I LOVE YOU
# 將語句中所有的大寫字母變成小寫字母。
$ echo "Hello World I Love You" |tr [A-Z] [a-z]
hello world i love you
# 也可以利用字元類進行轉換。
# [:lower:]代表小寫字母,[:upper:]代表大寫字母。
$ echo "Hello World I Love You" |tr [:lower:] [:upper:]
HELLO WORLD I LOVE YOU
3、刪除指定的字元
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
# 現在要刪除處理星期之外的所有字元。
# -d代表刪除,[0-9]代表所有的數字,[: ]代表冒號和空格。
$ cat test.txt | tr -d "[0-9][: ]"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
4、利用-c進行補集的替換
# 有時候在文本中我們只知道要保留的一些字元,其他字元種類繁多,就可以使用補集的替換。
$ cat test.txt
Monday 09:00
Tuesday 09:10
Wednesday 10:11
Thursday 11:30
Friday 08:00
Saturday 07:40
Sunday 10:00
# 我們只需要星期,則思路就是除了字母,其他統統替換掉。
# 這裡,-c:用分行符號替換掉除了字母外的所有字元;-s:刪除多餘的分行符號。
$ cat test.txt|tr -cs "[a-z][A-Z]" "\n"
Monday
Tuesday
Wednesday
Thursday
Friday
Saturday
Sunday
總結:其中大小寫字母的轉換,刪除不需要的字元比較常用。tr文法簡單,易用。