為什麼在ASP裡指定了codepage為65001還經常顯示亂碼.才子在這裡將這個問題詳細解釋一下,以免很多朋友再走彎路,甚至排斥UTF-8.
如果你還不知道UTF-8是什麼東東,那才子建議你先去搜尋一下UTF-8的相關資料吧.
UTF-8編碼之所以被越來越多的人接受甚至喜歡,肯定是有道理的,在WEB2.0盛行的今天,在大談多瀏覽器安全色的同時,不得不想到字元編碼不同所造成的亂碼現象同樣需要得到很好的處理.....
在N年以前,IE6以下的所有版本,只要沒有安裝相應的字型檔,訪問相關的頁面都是會亂碼的,例如,我是IE5 (Windows2000預設) 的版本,在沒有安裝IE繁體字型檔的情況下,訪問任何繁體頁面的網站都是會亂碼的,當然前提是該頁面採用了BIG5的Charset,而UTF-8作為一種國際編碼就能很好的處理該問題,只要將頁面存為UTF-8編碼格式,再在頁面上將codepage及charset全部定義為utf-8就可以在任何用戶端瀏覽器中顯示出完全正確的內容,完全不會亂碼......
好了,才子這裡以ASP頁面為例,以一個執行個體來看具體操作吧:
在這才子推薦用Editplus來寫代碼,才子也專門寫過一篇Editplus的使用教程,有興趣的朋友可以 點擊這裡 去看看.
開啟建立一個ASP頁面,相信玩ASP的朋友都會留意到,許多下載的源碼裡,頁面最上方一般都有一句:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="936"%>
前面的language應該不用多說了,vbscript就是ASP預設的指令碼語言,其實完全可以不用寫,寫了好像還會影響頁面執行效率,在這裡我們先不討論這個問題. 後面的codepage就是關鍵了,目的就是告訴瀏覽器,此頁面是何種編碼,936代表是簡體中文,而950代表繁體中文,65001就是我們今天說的UTF-8編碼了.我們將936改成65001,整句如下:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
再加上輸出幾個中文字看看能不能正確顯示吧.
<%
Response.Write "第一次測試UTF-8頁面"
%>
OK,直接點擊"儲存",執行這個頁面看看,如果不出意外,大家可能看到顯示出的是 "一尾UTF-8頁" 這幾個字,中文有亂碼的現象,什麼原因呢?
OK,請大家再點擊最上面的 "檔案" 菜單,選擇"另存新檔",最下面一行有個編碼,預設應該是ANSI的,請大家點下拉框,選擇UTF-8,再點儲存,再執行試試看,如果不出意外,亂得更厲害了,呵呵,暈了吧.別急,想想原因,因為我們做的頁面是HTML返回的,以前我們寫HTML時,看到body前面,也就是head裡都有一句meta,應該是這樣的:
<meta http-equiv="Content-Type" content="text/html; charset=gb2312">
也就是指定頁面以gb2312編碼返回結果,一定要寫在有返回結果輸出的前面.大家都知道gb2312是簡體中文吧,我們今天說的是UTF-8編碼,我們就將gb2312改成UTF-8吧,全部代碼如下:
<%@LANGUAGE="VBSCRIPT" CODEPAGE="65001"%>
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
<%
Response.Write "第一次測試UTF-8頁面"
%>
再執行看看,嗯,這次正常顯示了吧.......
結論:採用UTF-8編碼,除了要將檔案另存新檔UTF-8格式之外,還需要同時指定codepage及charset.