將Java/J2EE系統的統一編碼定義為UTF-8。UTF-8編碼是一種相容所有語言的編碼方式,惟一比較麻煩的就是要找到應用系統的所有出入口,然後使用UTF-8去“結紮”它。
一個J2EE應用系統需要做下列幾步工作:
- 開發和編譯代碼時指定字元集為UTF-8。JBuilder和Eclipse都可以在項目屬性中設定。
- 使用過濾器,如果所有請求都經過一個Servlet控制分配器,那麼使用Servlet的filter執行語句,將所有來自瀏覽器的請求(request)轉換為UTF-8,因為瀏覽器發過來的請求包根據瀏覽器所在的作業系統編碼,可能是各種形式編碼。關鍵一句:
request.setCharacterEncoding("UTF-8")。
網上有此filter的源碼,Jdon架構源碼中com.jdon.util.SetCharacterEncodingFilter
需要配置web.xml 啟用該Filter。
- 在JSP頭部聲明:<%@ page contentType="text/html;charset= UTF-8" %>。
- 在Jsp的html代碼中,聲明UTF-8:
<meta http-equiv="Content-Type" content="text/html; charset=utf-8">
- 設定資料庫連接方式是UTF-8。例如串連MYSQL時配置URL如下:
jdbc:mysql://localhost:3306/test?useUnicode=true&characterEncoding=UTF-8
注意,上述寫法是JBoss的mysql-ds.xml寫法,多虧網友提示,在tomcat中&要寫成&即可。一般其他資料庫都可以通過管理設定設定UTF-8
- 其他和外界互動時能夠設定編碼時就設定UTF-8,例如讀取檔案,操作XML等。
筆者以前在Jsp/Servlet時就採取這個原則,後來使用Struts、Tapestry、EJB、Hibernate、Jdon等架構時,從未被亂碼困擾過,可以說適合各種架構。希望本方案供更多初學者分享,減少Java/J2EE的第一個攔路虎,也避免因為採取一些臨時解決方案,導致中文問題一直出現在新的技術架構中。