Linux從zh_CN.GB2312遷移到zh_CN.UTF-8 – 包括 檔案內容編碼轉換,檔案名稱編碼轉換..

來源:互聯網
上載者:User
見附件

這篇文章非常不錯,講述了如何將: 

檔案內容,檔案名稱,MP3裡面的ID3 Tag,VIM。。。中的GB2312遷移到UTF-8的方法和實踐。 

摘錄一些特有用的: 

enca命令可以用來檢測一個文字檔的編碼 
iconv可用來轉換一個檔案的內容的編碼 
convmv可用來將檔案名稱做編碼轉換,而不是轉換檔內容 

GB2312 是國標裡面一個最小也是最早的中文編碼通訊協定。其中,只涵蓋了 6,763 個漢字。所以你需要轉換的檔案的原始的格式可能並不是 GB2312 編碼。這個時候,你可以用 GB18030 做為源格式來進行轉換。GB18030 是最新的國家標準,包含了 27,564 個漢字,而且向下相容 GB2312 和 GBK。

/Files/super119/linux_GB2312_to_UTF-8.mht.zip 

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.