1. 靜態頁面的亂碼問題
檔案的編碼和瀏覽器要顯示的編碼不一致。
1) 檢查檔案原始的編碼, 可以用記事本開啟, 然後選擇另存新檔來看;
2) 給當前頁面加入一個指令來建議瀏覽器用指定的編碼來顯示檔案字元內容.
<meta http-equiv="content-type" content="text/html; charset=GBK">
3) 如果系統是英文XP,沒裝東亞字元集支援, 也會顯示亂碼.
2. JSP 頁面的亂碼問題
1) page 指令有個 pageEncoding="GBK" 這個會指定當前頁面儲存的編碼, 如果寫成ISO8859-1 就不能儲存漢字;
2) page 指令的 contentType="text/html; charset=ISO8859-1" 也會像靜態頁面一樣讓瀏覽器來優先選擇一種編碼.
如果JSP 亂碼的話,一般就顯示成?,而且不管你給瀏覽器選什麼樣的編碼,它都不能正確顯示
3. 表單提交的亂碼問題(Tomcat 特有)
1). POST 的亂碼
a. 首先瀏覽器提交表單的編碼是根據表單所在頁面來決定的, 而不是根據提交後的JSP 頁面的編碼來決定的. 把所有的頁面的編碼都設定成一樣的,例如 GBK.
b. 處理方式就是在擷取參數之前設定編碼:
request.setCharacterEncoding("GBK");
c. 可以用過濾器的方式來解決, Tomcat 已經帶了一個現成的:
apache-tomcat-5.5.23\webapps\jsp-examples\WEB-INF\classes\filters\SetCharacter
EncodingFilter.java
web.xml
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>filters.SetCharacterEncodingFilter</filter-class>
<init-param>
<param-name>encoding</param-name>
<param-value>GBK</param-value>
</init-param>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
2) GET 方式的亂碼
用 setCharacterEncoding() 不能解決. TOMCAT 的一個BUG, GET 方式傳送的表單參數總是用的 ISO8859-1 編碼. 我們要把它轉成 GBK 方式.
String username = request.getParameter("username");
System.out.println(username);
// 轉碼, 先取得原始的二進位位元組數組
byte[] data = username.getBytes("ISO8859-1");
// 根據新的字元集再構造新的字串
username = new String(data, "GBK");
小結:
所有的頁面(除了最後的 GET 的亂碼問題)都用統一的編碼(GBK 或者UTF-8), 就不會出現亂碼問題.