在使用window下編緝好的檔案傳送到linux系統時,最鬧心的莫過於檔案不同的修改。之前我也寫過一篇關於excel下的檔案複製到linux下時造成的問題。vi查看空格、定位字元等特殊符號 ,而本篇可以作為那篇的一個後續吧!本來本文我是主要想講下dos2unix和unix2dos的。本想自己寫下,後來在網上看到有人總結的很不錯,索性拿來主義。如下文:
用途說明
dos2unix命令用來將DOS格式的文字檔轉換成UNIX格式的(DOS/MAC to UNIX text file format converter)。DOS下的文字檔是以rn作為斷行標誌的,表示成十六進位就是0D 0A。而Unix下的文字檔是以n作為斷行標誌的,表示成十六進位就是 0A。DOS格式的文字檔在Linux底下,用較低版本的vi開啟時行尾會顯示^M,而且很多命令都無法很好的處理這種格式的檔案,如果是個shell指令碼,。而Unix格式的文字檔在Windows下用Notepad開啟時會拼在一起顯示。因此產生了兩種格式檔案相互轉換的需求,對應的將UNIX格式文字檔轉成成DOS格式的是unix2dos命令。
常用參數
將DOS格式文字檔轉換成Unix格式,最簡單的用法就是dos2unix直接跟上檔案名稱。
格式:dos2unix file
如果一次轉換多個檔案,把這些檔案名稱直接跟在dos2unix之後。(註:也可以加上-o參數,也可以不加,效果一樣)
格式:dos2unix file1 file2 file3
格式:dos2unix -o file1 file2 file3
上面在轉換時,都會直接在原來的檔案上修改,如果想把轉換的結果儲存在別的檔案,而源檔案不變,則可以使用-n參數。
格式:dos2unix oldfile newfile
如果要保持檔案時間戳記不變,加上-k參數。所以上面幾條命令都是可以加上-k參數來保持檔案時間戳記的。
格式:dos2unix -k file
格式:dos2unix -k file1 file2 file3
格式:dos2unix -k -o file1 file2 file3
格式:dos2unix -k -n oldfile newfile
註:unix2dos命令的使用方式與dos2unix命令的類似。
使用樣本
樣本一 DOS格式文字檔在Linux下的表現
現在有一個指令檔job.sh,是在Linux下用vi編輯的。
[root@jfht ~]# cat job.sh
#!/bin/sh
date >job.txt
現在把它轉換成DOS格式文字檔。
[root@jfht ~]# unix2dos job.sh
unix2dos: converting file job.sh to DOS format ...
嘗試著運行一下。
[root@jfht ~]# ./job.sh
-bash: ./job.sh: 許可權不夠
[root@jfht ~]# chmod +x job.sh
[root@jfht ~]# ./job.sh
-bash: ./job.sh: /bin/sh^M: bad interpreter: 沒有那個檔案或目錄
DOS格式的指令檔時無法解釋執行的,因為指令檔的第一行是用來指定解譯器的,Linux系統認為解譯器是/bin/sh^M,而不是/bin/sh。
我們來通過Linux下的一些命令來看一下DOS格式檔案的真面目。
[root@jfht ~]# cat -v job.sh <== cat -v可以看到檔案中的非列印字元,而不帶-v參數的cat命令不行。
#!/bin/sh^M
^M
date >job.txt^M
^M
[root@jfht ~]# hexdump -C job.sh <== hexdump -C可以看到檔案每個位元組的十六進位表示。
00000000 23 21 2f 62 69 6e 2f 73 68 0d 0a0d 0a 64 61 74 |#!/bin/sh....dat|
00000010 65 20 3e 6a 6f 62 2e 74 78 74 0d 0a 0d 0a |e >job.txt....|
0000001e
[root@jfht ~]# vi job.sh <== 使用vi開啟時可以看到底下有[dos]的格式提示。有些版本vi顯示的是行尾為^M。
#!/bin/sh
date >job.txt
~
~
"job.sh" [dos] 4L, 30C
現在我們把DOS格式改回Unix格式的,看看效果。
root@jfht ~]# dos2unix job.sh
dos2unix: converting file job.sh to UNIX format ...
[root@jfht ~]# ./job.sh
可以執行了,不再報“-bash: ./job.sh: /bin/sh^M: bad interpreter: 沒有那個檔案或目錄”這個錯了。
[root@jfht ~]#
樣本二 dos2unix -k和dos2unix -n的使用樣本
[root@jfht ~]# cat <<EOF >1.txt
> 1
> 2
> 3
> EOF
[root@jfht ~]# file 1.txt
1.txt: ASCII text
[root@jfht ~]# ls -l 1.txt
-rw-r--r-- 1 root root 6 11-14 09:08 1.txt
[root@jfht ~]# date
2010年 11月 14日 星期日 09:28:42 CST
[root@jfht ~]# unix2dos -k 1.txt <== 保持檔案時間戳記
unix2dos: converting file 1.txt to DOS format ...
[root@jfht ~]# ls -l 1.txt
-rw-r--r-- 1 root root 9 11-14 09:08 1.txt
[root@jfht ~]# dos2unix -n 1.txt 2.txt <== 將1.txt轉換到2.txt
dos2unix: converting file 1.txt to file 2.txt in UNIX format ...
[root@jfht ~]# ls -l 1.txt 2.txt
-rw-r--r-- 1 root root 9 11-14 09:08 1.txt
-rw-r--r-- 1 root root 6 11-14 09:30 2.txt
[root@jfht ~]# file 1.txt 2.txt
1.txt: ASCII text, with CRLF line terminators
2.txt: ASCII text
[root@jfht ~]# cat -v 1.txt
1^M
2^M
3^M
[root@jfht ~]# cat -v 2.txt
1
2
3
本文中的cat -v命令與hexdump也適用於vi查看空格、定位字元等特殊符號這篇中關於號段是不是匯入出錯的查看。和vi中的no list效果是一樣的。同時也可以配合使用。當然hexdump在十六進位下查看是最能說明問題的。
r 0D
n 0A
t 09
DOS/Windows的分行符號 rn 即十六進位表示 0D 0A
Linux/Unix的分行符號 n 即十六進位表示 0A
excel中的定位字元是t