linux下與windows下的分行符號

來源:互聯網
上載者:User

linux下與windows下的分行符號       

 

斷行符號符號和分行符號號產生背景

關於“斷行符號”(carriage return)和“換行”(line feed)這兩個概念的來曆和區別。
在電腦還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33)的玩意,每秒鐘可以打10個字元。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字元。要是在這0.2秒裡面,又有新的字元傳過來,那麼這個字元將丟失。
     於是,研製人員想了個辦法解決這個問題,就是在每行後面加兩個表示結束的字元。一個叫做“斷行符號”,告訴打字機把列印頭定位在左邊界;另一個叫做“換行”,告訴打字機把紙向下移一行。
這就是“換行”和“斷行符號”的來曆,從它們的英語名字上也可以看出一二。
      後來,電腦發明了,這兩個概念也就被般到了電腦上。那時,儲存空間很貴,一些科學家認為在每行結尾加兩個字元太浪費了,加一個就可以。於是,就出現了分歧。
Unix系統裡,每行結尾只有“<換行>”,即“\n”;Windows系統裡面,每行結尾是“ <斷行符號><換行>”,即“\r\n”;Mac系統裡,每行結尾是“<斷行符號>”。一個直接後果是,Unix/Mac系統下的檔案在Windows裡開啟的話,所有文字會變成一行;而Windows裡的檔案在Unix/Mac下開啟的話,在每行的結尾可能會多出一個^M符號

windows建立的檔案是 \n\r結束的, 而linux,mac這種unix類系統是\n結束的。

所以unix的文本到windows會出現換行丟失(ultraedit這種軟體可以正確識別); 而反過來就會出現^M的符號了

Windows等作業系統用的文本分行符號和UNIX/Linux作業系統用的不同,Windows系統下輸入的分行符號在UNIX/Linux下不會顯示為“換行”,而是顯示為 ^M 這個符號(這是Linux等系統下規定的特殊標記,佔一個字元大小,不是 ^ 和 M 的組合,列印不出來的)。Linux下很多文字編輯器(命令列)會在顯示這個標記之後,補上一個自己的分行符號,以避免內容混亂(只是用於顯示,補充的分行符號不會寫入檔案,有專門的命令將Windows分行符號替換為Linux分行符號)。
UNIX/Linux系統下的分行符號在Windows系統的文字編輯器中會被忽略,整個文本會亂成一團。

windows換行是\r\n,十六進位數值是:0D0A。
LINUX換行是\n,十六進位數值是:0A
所以在linux儲存的檔案在windows上用記事本看的話會出現黑點,我們可以在LINUX下用命令把linux的檔案格式轉換成win格式的。
unix2dos 是把linux檔案格式轉換成windows檔案格式
dos2unix 是把windows格式轉換成linux檔案格式。

linux下刪除windows分行符號^M

OJ判題時發現一個問題:用%c讀入的代碼都會報wa。後來發現跟scanf有關。在linux下使用%c會讀到\n和\r兩個字元。所以需要將^M(也就是\r)字元刪掉
刪除方法不少。找了一個比較簡單的。
要將a.txt裡的^M去掉並寫入b.txt,則使用如下指令cat a.txt | tr -d "^M" > b.txt
注意:語句中的^M是通過ctrl+V, ctrl+M輸入的。特指/r字元

 

unix   下分行符號只有:   \r
       Dos   下分行符號有:\r\n
具體的,   \r的ascii   碼是:13 
                 \n的ascii   碼是:10

 

 

win:“\r\n”,0x0D0A;
linux:“\n”,0x0A;
mac:"\r",0x0D;

斷行符號符號和分行符號號產生背景

關於“斷行符號”(carriage return)和“換行”(line feed)這兩個概念的來曆和區別。
在電腦還沒有出現之前,有一種叫做電傳打字機(Teletype Model 33)的玩意,每秒鐘可以打10個字元。但是它有一個問題,就是打完一行換行的時候,要用去0.2秒,正好可以打兩個字元。要是在這0.2秒裡面,又有新的字元傳過來,那麼這個字元將丟失。
     於是,研製人員想了個辦法解決這個問題,就是在每行後面加兩個表示結束的字元。一個叫做“斷行符號”,告訴打字機把列印頭定位在左邊界;另一個叫做“換行”,告訴打字機把紙向下移一行。
這就是“換行”和“斷行符號”的來曆,從它們的英語名字上也可以看出一二。
      後來,電腦發明了,這兩個概念也就被般到了電腦上。那時,儲存空間很貴,一些科學家認為在每行結尾加兩個字元太浪費了,加一個就可以。於是,就出現了分歧。
Unix系統裡,每行結尾只有“<換行>”,即“\n”;Windows系統裡面,每行結尾是“ <斷行符號><換行>”,即“\r\n”;Mac系統裡,每行結尾是“<斷行符號>”。一個直接後果是,Unix/Mac系統下的檔案在Windows裡開啟的話,所有文字會變成一行;而Windows裡的檔案在Unix/Mac下開啟的話,在每行的結尾可能會多出一個^M符號

windows建立的檔案是 \n\r結束的, 而linux,mac這種unix類系統是\n結束的。

所以unix的文本到windows會出現換行丟失(ultraedit這種軟體可以正確識別); 而反過來就會出現^M的符號了

Windows等作業系統用的文本分行符號和UNIX/Linux作業系統用的不同,Windows系統下輸入的分行符號在UNIX/Linux下不會顯示為“換行”,而是顯示為 ^M 這個符號(這是Linux等系統下規定的特殊標記,佔一個字元大小,不是 ^ 和 M 的組合,列印不出來的)。Linux下很多文字編輯器(命令列)會在顯示這個標記之後,補上一個自己的分行符號,以避免內容混亂(只是用於顯示,補充的分行符號不會寫入檔案,有專門的命令將Windows分行符號替換為Linux分行符號)。
UNIX/Linux系統下的分行符號在Windows系統的文字編輯器中會被忽略,整個文本會亂成一團。

windows換行是\r\n,十六進位數值是:0D0A。
LINUX換行是\n,十六進位數值是:0A
所以在linux儲存的檔案在windows上用記事本看的話會出現黑點,我們可以在LINUX下用命令把linux的檔案格式轉換成win格式的。
unix2dos 是把linux檔案格式轉換成windows檔案格式
dos2unix 是把windows格式轉換成linux檔案格式。

linux下刪除windows分行符號^M

OJ判題時發現一個問題:用%c讀入的代碼都會報wa。後來發現跟scanf有關。在linux下使用%c會讀到\n和\r兩個字元。所以需要將^M(也就是\r)字元刪掉
刪除方法不少。找了一個比較簡單的。
要將a.txt裡的^M去掉並寫入b.txt,則使用如下指令cat a.txt | tr -d "^M" > b.txt
注意:語句中的^M是通過ctrl+V, ctrl+M輸入的。特指/r字元

 

unix   下分行符號只有:   \r
       Dos   下分行符號有:\r\n
具體的,   \r的ascii   碼是:13 
                 \n的ascii   碼是:10

 

 

win:“\r\n”,0x0D0A;
linux:“\n”,0x0A;
mac:"\r",0x0D;

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.