linux亂碼問題:LANG變數的秘訣

最後更新：2018-12-06 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

http://www.zhidun.com/phpbb/viewtopic.php?t=2396

對於國內的Linux使用者,經常煩惱的一個問題是:系統常常在需要顯示中文的時候卻顯示成了亂碼,而由於某些原因,需要英文介面的系統的時候,卻苦於系統不能正常輸入和顯示中文.另外,由於大部分主要Linux發行版都是以英語為主體的,英文介面的系統和應用程式不管在介面的美觀程度和穩定程度上都比中文的略好一些,各種奇怪的BUG也要少一些。因此，很多稍微有英語基礎的Linux使用者都寧願使用英文介面的系統。但是，矛盾又突現出來：在英文系統下，如何才能正常顯示和輸入中文呢？有沒有兩全其美的方案呢？因此，筆者開始探索如何解決這個問題。我的完美狀態是：系統和應用程式全部為英文(系統功能表、應用程式工具列、預設IME等），而我需要閱讀和撰寫中文文檔的時候，能正確的顯示中文並調出中文IME。經過嘗試，設定成功，現在以FC4　Linux為例，講解一些相關知識和設定過程。

本文主要通過修改系統配置的過程來展現修改linux系統配置的一般思路和過程，如果你不太有耐心看完，請跳過文章的1—4節，直接看第五節快速設定部分。

一，相關變數介紹

我們知道大部分Linux系統是無所謂中文版和英文版的，以FC4　Linux為例,系統發行的時候全世界都一樣，系統是中文的還是英文的完全取決於你選擇的語言套件。不同國家的人在安裝使用的時候選擇屬於自己國家的語言套件，應用程式中的語言也不是寫死的，它根據系統的設定來調用相關的語言，所以，一個應用程式寫出來不經過修改，全世界不同國家的使用者都可以以母語介面使用它，這就事所謂的internationalization（國際化），簡稱 i18n。這也是未來軟體的發展趨勢。

那麼，如果我在系統中安裝了不同的語言套件和不同的字型，系統是如何判斷我所要的語言介面並調用相關的字型的呢？系統中那些檔案和變數在控制這些呢？

在redHat和FC系列Linux系統下，記錄系統預設使用語言的檔案是/etc/sysconfig/i18n,如果預設安裝的是中文的系統，i18n的內容如下：
代碼:

LANG="zh_CN.UTF-8" SYSFONT="latarcyrheb-sun16" SUPPORTED="zh_CN.UTF-8:zh_CN:zh"

其中LANG變數是language的簡稱，稍微有英語基礎的使用者一看就看出來這個變數是決定系統的預設語言的，即系統的菜單、程式的工具列語言、IME預設語言等。SYSFONT是system font的簡稱，決定系統預設用哪一種字型。SUPPORTED變數決定系統支援的語言，即系統能夠顯示的語言。需要說明的是，由於電腦起源於英語國家，因此，不管你把這些變數設定成什麼，英語總是預設支援的，而且不管用什麼字型，英文字型總包含在其中。

這些變數中LANG變數是在字元模式和圖形介面下都用到的，在你登入系統後就被讀取並生效，相信很多人在字元介面下輸入Linux命令的時候經常會遇到顯示出來的出錯資訊是亂碼的情況，必需安裝zhcon或者cce等字元模式下的中文軟體才能正常顯示中文的出錯資訊。如果我不要他顯示中文亂碼，我也不要為了看個很簡單的出錯資訊而特意起用zhcon那我該怎麼辦呢？一個簡單的零時解決的辦法就是設定一下LANG變數：
代碼:

[root@gucuiwen ~]# LANG="en_US.UTF-8"

即把系統的語言臨時設定成英文，或者更簡單一點，可以直接這樣：
代碼:

[root@gucuiwen ~]# LANG=""

即把LANG變數清空，由於英語是無論什麼情況都支援的，LANG變數被清空後，系統就預設用英語。這樣設定後，在字元模式下輸出的出錯資訊等就是全英文的了。但這種設定是臨時的，只是臨時改變了LANG這個bash變數而已。當退出重新登入或者切換到其他字元終端後就無效了。到現在，讀者應該想到了，只要把i18n檔案中的LANG變數設定成英文的”en_US.UTF-8”，就可以永久解決這個問題了。修改後的檔案如下：
代碼:

#LANG="zh_CN.UTF-8" LANG="en_US.UTF-8" SYSFONT="latarcyrheb-sun16" SUPPORTED="zh_CN.UTF-8:zh_CN:zh"

請不要把LANG變數簡單的清空，因為這個變數不僅在字元模式下用到，在圖形介面下也用到，簡單清空在字元模式下確實不會有問題，但在圖形介面下，卻會造成中文無法正常顯示的情況，在過去Re d ha t 系列的版本中i18n檔案中還有一個叫LANGUAGE的變數，專門控製圖形介面下的語言設定，現在的FC系列中已經把這兩個變數整合成一個變數了。

經過修改這個變數，重新起動圖形介面後，就可以看到介面一經完全是英文的了。但是按ctrl+空格卻不能調出中文IME，IME菜單中也不能添加中文IME。我們只簡單的修改了LANG變數改變了系統語言設定，當然這一步也可以用圖形介面下的工具修改，而不用親自修改設定檔。

二，關於運行等級

這個問題似乎和這篇文章的的主題無關，但是介於現在越來越多的linux新手遇到linux圖形介面的問題，而且在中文IME設定過程中也牽涉到這些問題，因此想順便提一下。

現在的linux安裝完成後，預設就運行在第5個系統運行層級。在SYSTEM V 風格的UNIX系統中，系統被分為不同的運行層級，這和BSD分支的UNIX有所不同，常用的為0~6七個層級:

0　關機
1　單使用者
2　不帶網路的多使用者
3　帶網路的多使用者
4　保留，使用者可以自給定義
5　圖形介面的多使用者
6　重起系統

由於現在的Linux系統安裝完後就運行在第5個層級，即系統啟動後直接進入圖形介面，而不用在字元模式下登入後用startx或者xinit 來起動圖形介面。這樣看起來很方便。但是有什麼壞處呢？　一旦你改變了某些設定，顯示出問題的時候，系統不斷在圖形和字元間派徊，新手又不知道如何應對，十分麻煩，而且對於學習研究Linux的人來說，這樣不利於瞭解和學習Linux底層的一些東西。很早就用Linux的老使用者都知道，過去的Linux如 redhat6.0，都是預設運行接別為3，即使後來的RedHat9.0也可以在安裝時候選預設字元登入還是圖形登入。但現在的FC系列和其他大多數版本都不管三七二十一直接幫使用者選擇了直接圖形介面登入。雖然對於大多數菜鳥來說，Linux確實越來越簡單了，但是很多樂趣，那些新手也體驗不到了。

也許你不相信，直接圖形登入到系統確實會有很多問題，因此，作為一個有6年Linux使用經驗的Linux和Solaris 系統管理員，我強烈建議在系統安裝完成後把系統的預設運行等級設定在第3級，在字元終端登入後，再手工輸入startx 命令起動圖形介面。可以用如下的方法修改：
用文字編輯器修改　/etc/inittab檔案，把
代碼:

id:5:initdefault:

這一行，修改成
代碼:

id:3:initdefault:

儲存後就重起，系統就預設起動到字元介面。不同運行層級之間的差別的在於系統預設起動的服務的不同，如運行層級3預設不啟動X圖形介面服務，而運行層級5 卻預設起動。本質上是沒有區別的，更無所謂不同層級間功能強弱的問題。使用者完全可自給定義不同層級的預設服務。在任何運行層級，使用者都可用init 命令來切換到其他運行層級。

三，調出中文IME：

我之所以要在上面費那麼多筆墨來講系統運行層級，是因為對系統的認識是從底部向上開始的。
先把預設運行層級修改成3層級，當然，如果你實在不想修改，就臨時用init 3命令切換到第3級。

這樣你就可以用startx起動圖形介面，然後用ctrl+alt+backspace退出圖形介面。請注意我說的是“退出”圖形介面，而不是按ctrl+alt＋F2切到一個字元終端。

好了，一切由startx開始。當你需要在Linux系統中設定某個東西，或者配置某個服務的時候，最關鍵的是要知道，這一切是怎麼開始的。知其然必需知其所以然。如果你有空把/etc/rc.d目錄下的系統起動時啟動並執行指令碼通讀一遍，就完全知道了/etc下的各種設定檔是用來幹什麼的、如何修改、修改後有什麼效果等等。玩起系統來也能隨心所欲想怎麼改就怎麼改。這就是我一直強調的,知其然一定要知其所以然。一定要深入系統，讀指令碼，學會用命令和手工修改系統設定檔。這樣對系統才會有透徹的瞭解，整天用圖形介面的工具是不能協助你對系統有教為透徹深入的瞭解的，不同的linux系統提供的圖形介面配置程式會不同，但命令和設定檔都是相同的，越是底層的東西越具有通用性。所以，應當先學會手動設定和修改系統設定檔，等熟悉了以後，再用圖形介面的工具修改，以便減少工作量。

上面提了一下我解決問題的思路。我是順著這個思路開始的：

中文IME是在圖形介面下使用的，是圖形介面下啟動並執行一個程式。而圖形介面中的一切，都是由startx程式開啟啟動並執行。這就是問題的根源。

找出startx的位置：
代碼:

[root@gucuiwen ~]# which startx /usr/X11R6/bin/startx

看startx是一個指令碼還是二進位檔案：
代碼:

[root@gucuiwen ~]# file /usr/X11R6/bin/startx /usr/X11R6/bin/startx: Bourne shell script text executable

發現startx是一個shell 指令碼，於是我開啟它分析並閱讀，看看能不能找到一些關於IME起動過程和相關變數的線索：
代碼:

[root@gucuiwen ~]# vi /usr/X11R6/bin/startx

我找到了該指令碼在運行過程中調用的其他指令碼和設定檔的資訊：
代碼:

userclientrc=$HOME/.xinitrc userserverrc=$HOME/.xserverrc sysclientrc=/etc/X11/xinit/xinitrc sysserverrc=/etc/X11/xinit/xserverrc

並且知道，startx的目的是尋找系統中可用的案頭系統X伺服器系統、以及使用者自訂的參數，最終調用xinit來初始化X圖形介面。我沒有在startx指令碼中找到直接和起動IME相關的代碼，於是就可以肯定，IME相關的代碼在startx調用的指令碼中。於是我來到
/etc/X11/xinit/ 目錄下，閱讀並分析該目錄下的指令碼，這些指令碼有些是startx直接調用的，有些是被startx調用的指令碼再調用的，存在著多級嵌套的關係，沒有一點耐心還真是搞不清楚。最終我在/etc/X11/xinit/xinitrc.d目錄中的xinput.sh指令碼中找到了和IME相關的代碼：
代碼:

lang_region=$(echo $tmplang | sed -e 's/"..*//') lang_region="zh_CN"　 #這一行是修改後加上去的 for f in $HOME/.xinput.d/${lang_region} " $HOME/.xinput.d/default " /etc/X11/xinit/xinput.d/${lang_region} " /etc/X11/xinit/xinput.d/default ; do [ -r $f ] && source $f && break done

通過分析指令碼，我知道，圖形介面啟動的時候指令碼是根據LANG變數來決定是否啟用IME，以及啟用哪種語言的IME等。問題在於：我們還沒有把LANG變數改成英語之前，系統得到的LANG變數是中文的，因此，它知道需要在圖形介面啟動過程中啟用中文IME，但把LANG變數改成英文後，系統根據LANG 變數知道系統是英文的，它便不再啟動中文IME，也不再設定和匯出相關的變數，導致中文IME不可用。因此，只要在這個指令碼中，“騙”過系統，讓IME指令碼“以為”系統是中文的，它不就運行中文IME，並匯出相關變數了嗎？　於是，通過分析指令碼，我在xinput.sh中的：
代碼:

lang_region=$(echo $tmplang | sed -e 's/"..*//') 後面又添加了 lang_region="zh_CN"

直接把lang_region=$(echo $tmplang | sed -e 's/"..*//')　修改成　lang_region="zh_CN"　也可以
多添加一行是為了以後改過來方便，直接刪除添加的一行就可以了。

當然，把for迴圈中的/etc/X11/xinit/xinput.d/${lang_region}該成
/etc/X11/xinit/xinput.d/zh _CN也可以。

當然還有其他的改法，前提是你要懂得shell 指令碼的文法，看得懂指令碼的意思。這樣修改後，即便系統是英文的，xinput.sh指令碼也會去讀取/etc/X11/xinit/xinput.d/zh _CN　檔案並匯出其中的內容、設定好XMODIFERS等IME變數，並運行iiimxIME程式。

那麼為什麼不在圖形介面啟動後直接運行iiimxIME程式呢？實驗一下就知道，這根本不行。因為IME程式是須要和被輸入的應用程式配合啟動並執行軟體，在運行過程中需要匯出很多變數。直接運行iiimx只運行了主程式，而沒相關變數，沒辦法和應用程式配合完成輸入工作。

完成修改工作後，儲存指令檔。輸入startx命令啟動圖形介面，就可以用全英文的系統介面和中文IME了。但需要注意的是：由於系統是全英文的，預設IME也是英文，通過GNOME或者KDE菜單起動的應用程式第一次輸入中文的時候不能按ctrl+空格來切換到中文，需要用滑鼠在工作列上點擊IME表徵圖切換，第一次切換後以後就可以用ctrl+空格快速鍵來切換中英文IME了。

四，一些後續問題

某些軟體，比如Open Office，通過GNOME或者KDE菜單啟動的話，即使切換到中文IME也輸不進中文，這是因為整個案頭系統的環境是英文的，軟體“繼承”了英文環境的相關變數，這些軟體就“認死理”，就是不讓輸入中文，這時候可以開啟一個gnome終端，把LANG變數臨時設定成zh_CN.UTF-8　：

[root@gucuiwen ~]# LANG="zh_CN.UTF-8"

然後在這個gnome終端中，用命令開啟open office:

[root@gucuiwen ~]# oowriter &

這樣Open Office就“繼承”了gnome終端的LANG變數，起動後，工具列和菜單等都是中文的，而且能輸入中文。推而廣之，任何軟體都可以用這種方法，根據需要，開啟中文介面的軟體和英文介面的軟體。要以英文介面運行軟體時，只要從GNOME或者KDE菜單開啟，要用中文介面運行軟體時，在終端中修該 LANG變數，從修改過LANG變數的終端中通過命令運行即可。當然，如果你還安裝了其他語言的字型，你還可以以其他語言的介面來運行程式。如日語：

[root@gucuiwen ~]# LANG="ja_JP.UTF-8"
[root@gucuiwen ~]# gedit &

我用上面的兩條命令開啟的gedit 編輯器就是全日語介面的，但是能輸入中文和英文，並顯示日文。從而達到，一個系統，多種語言和文字共存的目的。

當然，前提是要安裝了日語字型和日語locale，否則所有有文字的地方會全部顯示成一連串問號。總之，要先懂得原理，之後想怎麼玩就怎麼玩，隨心所欲，完全不受限制，充分享受用Linux的樂趣。

五,　快速設定步驟：

1.修改/etc/sysconf/i18n檔案，把
LANG="zh_CN.UTF-8"
修改成：
LANG="en_US.UTF-8"

2.修改/etc/X11/xinit/xinitrc.d/xinput.sh檔案，把其中一行：

lang_region=$(echo $tmplang | sed -e 's/"..*//')

修改成：

lang_region=”zh_CN”

3,重新啟動圖形介面，就可以用英文的介面並且正確顯示中文和輸入中文。

--------------------------------------------------------------------

以下為個人補充:

用ssh登入LINUX時,ssh終端有時會出現亂碼,即使你設定LANG=en_US.UTF-8也一樣.我試過SecureCRT,OpenSSH,SSH Secure Shell的用戶端,都出現過這問題.有時更改一下用戶端的設定就好了,但是有時更改用戶端的設定後只能運行一次某個命令,之後又變成亂碼了.

一個偶然的機會,在網上看到有人說將LANG變數的值改成"C"就行了.不過還真邪了,就來個LANG=C,什麼問題都解決了,也不用設定用戶端了,真是莫名其妙!不過到現在還不知道那個"C"是什麼意思,它咋就那麼厲害.

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More