關於Servlet、Jsp中的多國語言顯示

來源:互聯網
上載者:User
js|servlet|顯示

因為一直不信Java竟會有不能混排顯示多國語言的BUG,這個周末研究了一下Servlet、Jsp的多國語言顯示的問題,也就是Servlet的多字元集問題,由於我對字元集的概念還不是很清晰所以寫出的東西未必是準確的,我是這樣理解Java中的字元集的:在運行時,每個字串對象中儲存的都是編碼為UNICODE內碼的(我覺得所有的語言中都是有相應編碼的,因為在電腦內部字串總是用內碼來表示的,只不過一般電腦語言中的字串編碼時平台相關的,而Java則採用了平台無關的UNICODE)。

Java從一個byte流中讀取一個字串時,將把平台相關的byte轉變為平台無關的Unicode字串。在輸出時Java將把Unicode字串轉變為平台相關的byte流,如果某個Unicode字元在某個平台上不存在,將會輸出一個´?´。舉個例子:在中文Windows中,Java讀出一個"GB2312"編碼的檔案(可以是任何流)到記憶體中構造字串對象,將會把GB2312編碼的文字轉變為Unicode編碼的字串,如果把這個字串輸出又將會把Unicode字串轉化為GB2312的byte流或數組:"中文測試"----->"u4e2du6587u6d4bu8bd5"----->"中文測試"。

如下常式:

byte[] bytes = new byte[]{(byte)0xd6, (byte)0xd0, (byte)0xce, (byte)0xc4, (byte)0xb2, (byte)0xe2, (byte)0xca, (byte)0xd4};//GBK編碼的"中文測試"

java.io.ByteArrayInputStream bin = new java.io.ByteArrayInputStream(bytes);

java.io.BufferedReader reader = new java.io.BufferedReader(new java.io. InputStreamReader (bin,"GBK"));

String msg = reader.readLine();

System.out.println(msg)

這段程式放到包含"中文測試"這四個字的系統(如中文系統)中,可以正確地列印出這些字。msg字串中包含了正確的"中文測試"的Unicode編碼:"u4e2du6587u6d4bu8bd5",列印時轉換為作業系統的預設字元集,是否可以正確顯示依賴於作業系統的字元集,只有在支援相應字元集的系統中,我們的資訊才能正確的輸出,否則得到的將會是垃圾。

話入正題,我們來看看Servlet/Jsp中的多語言問題。我們的目標是,任一國家的用戶端通過Form向Server發送資訊,Server把資訊存入資料庫中,用戶端在檢索時仍然能夠看到自己發送的正確資訊。事實上,我們要保證,最終Server中的SQL語句中儲存的時包含用戶端發送文字的正確Unicode編碼;DBC與資料庫通訊時採用的編碼方式能包含用戶端發送的文字資訊,事實上,最好讓JDBC直接使用UNICODE/UTF8與資料庫通訊!這樣就可以確保不會丟失資訊;Server向用戶端發送的資訊時也要採用不丟失資訊的編碼方式,也可以是Unicode/Utf8。

如果不指定Form的Enctype屬性,Form將把輸入的內容依照當前頁面的編碼字元集urlencode之後再提交,伺服器端得到是urlencoding的字串。編碼後得到的urlencoding字串是與頁面的編碼相關的,如gb2312編碼的頁面提交"中文測試",得到的是"%D6%D0%CE%C4%B2%E2%CA%D4",每個"%"後跟的是16進位的字串;而在UTF8編碼時得到的卻是"%E4%B8%AD%E6%96%87%E6%B5%8B%E8%AF%95",因為GB2312編碼中一個漢字是16位的,而UTF8中一個漢字卻是24位的。中日韓三國的ie4以上瀏覽器均支援UTF8編碼,這種方案肯定包涵了這三國語言,所以我們如果讓Html頁面使用UTF8編碼那麼將至少可以支援這三國語言。

但是,如果我們html/Jsp頁面使用UTF8編碼,因為應用程式伺服器可能不知道這種情況,因為如果瀏覽器發送的資訊不包含charset資訊,至多Server知道讀到Accept-Language請求投標,我們知道僅靠這個投標是不能獲知瀏覽器所採用編碼的,所以應用程式伺服器不能正確解析提交的內容,為什嗎?因為Java中的所有字串都是Unicode16位編碼的,HttpServletRequest.request(String)的功能就是把用戶端提交的Urlencode編碼的資訊轉為Unicode字串,有些Server只能認為用戶端的編碼和Server平台相同,簡單地使用URLDecoder.decode(String)方法直接解碼,如果用戶端編碼恰好和Server相同,那麼就可以得到正確地字串,否則,如果提交地字串中包含了當地字元,那麼將會導致垃圾資訊。

在我提出的這個解決方案裡,已經指定了採用Utf8編碼,所以,可以避免這個問題,我們可以自己定製出decode方法:

public static String decode(String s,String encoding) throws Exception {

StringBuffer sb = new StringBuffer();

for(int i=0; ichar c = s.charAt(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)Integer.parseInt(

s.substring(i+1,i+3),16));

}

catch (NumberFormatException e) {

throw new IllegalArgumentException();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// Undo conversion to external encoding

String result = sb.toString();

byte[] inputBytes = result.getBytes("8859_1");

return new String(inputBytes,encoding);

}

這個方法可以指定encoding,如果把它指定為UTF8就滿足了我們的需要。比如用它解析:"%E4%B8%AD%E6%96%87%E6%B5%8B%E8%AF%95"就可以得到正確的漢字"中文測試"的Unicode字串。

現在的問題就是我們必須得到用戶端提交的Urlencode的字串。對於method為get的form提交的資訊,可以用HttpServletRequest.getQueryString()方法讀到,而對於post方法的form提交的資訊,只能從ServletInputStream中讀到,事實上標準的getParameter方法被第一次調用後,form提交的資訊就被讀取出來了,而ServletInputStream是不能重複讀出的。所以我們應在第一次使用getParameter方法前讀取並解析form提交的資訊。

  我是這麼做的,建立一個Servlet基類,覆蓋service方法,在調用父類的service方法前讀取並解析form提交的內容,請看下面的原始碼:

package com.hto.servlet;

import javax.servlet.http.HttpServletRequest;

import java.util.*;

/**

* Insert the type´s description here.

* Creation date: (2001-2-4 15:43:46)

* @author: 錢衛春

*/

public class UTF8ParameterReader {

Hashtable pairs = new Hashtable();

/**

* UTF8ParameterReader constructor comment.

*/

public UTF8ParameterReader(HttpServletRequest request) throws java.io.IOException{

super();

parse(request.getQueryString());

parse(request.getReader().readLine());

}

/**

* UTF8ParameterReader constructor comment.

*/

public UTF8ParameterReader(HttpServletRequest request,String encoding) throws java.io.IOException{

super();

parse(request.getQueryString(),encoding);

parse(request.getReader().readLine(),encoding);

}

public static String decode(String s) throws Exception {

StringBuffer sb = new StringBuffer();

for(int i=0; ichar c = s.charAt(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)Integer.parseInt(

s.substring(i+1,i+3),16));

}

catch (NumberFormatException e) {

throw new IllegalArgumentException();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// Undo conversion to external encoding

String result = sb.toString();

byte[] inputBytes = result.getBytes("8859_1");

return new String(inputBytes,"UTF8");

}

public static String decode(String s,String encoding) throws Exception {

StringBuffer sb = new StringBuffer();

for(int i=0; ichar c = s.charAt(i);

switch (c) {

case ´+´:

sb.append(´ ´);

break;

case ´%´:

try {

sb.append((char)Integer.parseInt(

s.substring(i+1,i+3),16));

}

catch (NumberFormatException e) {

throw new IllegalArgumentException();

}

i += 2;

break;

default:

sb.append(c);

break;

}

}

// Undo conversion to external encoding

String result = sb.toString();

byte[] inputBytes = result.getBytes("8859_1");

return new String(inputBytes,encoding);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-4 17:30:59)

* @return java.lang.String

* @param name java.lang.String

*/

public String getParameter(String name) {

if (pairs == null || !pairs.containsKey(name)) return null;

return (String)(((ArrayList) pairs.get(name)).get(0));

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-4 17:28:17)

* @return java.util.Enumeration

*/

public Enumeration getParameterNames() {

if (pairs == null) return null;

return pairs.keys();

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-4 17:33:40)

* @return java.lang.String[]

* @param name java.lang.String

*/

public String[] getParameterValues(String name) {

if (pairs == null || !pairs.containsKey(name)) return null;

ArrayList al = (ArrayList) pairs.get(name);

String[] values = new String[al.size()];

for(int i=0;ivalues[i] = (String) al.get(i);

return values;

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-4 20:34:37)

* @param urlenc java.lang.String

*/

private void parse(String urlenc) throws java.io.IOException{

if (urlenc == null) return;

StringTokenizer tok = new StringTokenizer(urlenc,"&");

try{

while (tok.hasMoreTokens()){

String aPair = tok.nextToken();

int pos = aPair.indexOf("=");

String name = null;

String value = null;

if(pos != -1){

name = decode(aPair.substring(0,pos));

value = decode(aPair.substring(pos+1));

}else{

name = aPair;

value = "";

}

if(pairs.containsKey(name)){

ArrayList values = (ArrayList)pairs.get(name);

values.add(value);

}else{

ArrayList values = new ArrayList();

values.add(value);

pairs.put(name,values);

}

}

}catch(Exception e){

throw new java.io.IOException(e.getMessage());

}

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-4 20:34:37)

* @param urlenc java.lang.String

*/

private void parse(String urlenc,String encoding) throws java.io.IOException{

if (urlenc == null) return;

StringTokenizer tok = new StringTokenizer(urlenc,"&");

try{

while (tok.hasMoreTokens()){

String aPair = tok.nextToken();

int pos = aPair.indexOf("=");

String name = null;

String value = null;

if(pos != -1){

name = decode(aPair.substring(0,pos),encoding);

value = decode(aPair.substring(pos+1),encoding);

}else{

name = aPair;

value = "";

}

if(pairs.containsKey(name)){

ArrayList values = (ArrayList)pairs.get(name);

values.add(value);

}else{

ArrayList values = new ArrayList();

values.add(value);

pairs.put(name,values);

}

}

}catch(Exception e){

throw new java.io.IOException(e.getMessage());

}

}

}

這個類的功能就是讀取並儲存form提交的資訊,並實現常用的getParameter方法。

package com.hto.servlet;

import java.io.*;

import javax.servlet.*;

import javax.servlet.http.*;

/**

* Insert the type´s description here.

* Creation date: (2001-2-5 8:28:20)

* @author: 錢衛春

*/

public class UtfBaseServlet extends HttpServlet {

public static final String PARAMS_ATTR_NAME = "PARAMS_ATTR_NAME";

/**

* Process incoming HTTP GET requests

*

* @param request Object that encapsulates the request to the servlet

* @param response Object that encapsulates the response from the servlet

*/

public void doGet(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {

performTask(request, response);

}

/**

* Process incoming HTTP POST requests

*

* @param request Object that encapsulates the request to the servlet

* @param response Object that encapsulates the response from the servlet

*/

public void doPost(HttpServletRequest request, HttpServletResponse response) throws ServletException, IOException {

performTask(request, response);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue int

*/

public static java.sql.Date getDateParameter(HttpServletRequest request, String name, boolean required, java.sql.Date defValue) throws ServletException{

String value = getParameter(request,name,required,String.valueOf(defValue));

return java.sql.Date.valueOf(value);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue int

*/

public static double getDoubleParameter(HttpServletRequest request, String name, boolean required, double defValue) throws ServletException{

String value = getParameter(request,name,required,String.valueOf(defValue));

return Double.parseDouble(value);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue int

*/

public static float getFloatParameter(HttpServletRequest request, String name, boolean required, float defValue) throws ServletException{

String value = getParameter(request,name,required,String.valueOf(defValue));

return Float.parseFloat(value);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue int

*/

public static int getIntParameter(HttpServletRequest request, String name, boolean required, int defValue) throws ServletException{

String value = getParameter(request,name,required,String.valueOf(defValue));

return Integer.parseInt(value);

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:43:36)

* @return java.lang.String

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue java.lang.String

*/

public static String getParameter(HttpServletRequest request, String name, boolean required, String defValue) throws ServletException{

if(request.getAttribute(UtfBaseServlet.PARAMS_ATTR_NAME) != null) {

UTF8ParameterReader params = (UTF8ParameterReader)request.getAttribute(UtfBaseServlet.PARAMS_ATTR_NAME);

if (params.getParameter(name) != null) return params.getParameter(name);

if (required) throw new ServletException("The Parameter "+name+" Required but not provided!");

else return defValue;

}else{

if (request.getParameter(name) != null) return request.getParameter(name);

if (required) throw new ServletException("The Parameter "+name+" Required but not provided!");

else return defValue;

}

}

/**

* Returns the servlet info string.

*/

public String getServletInfo() {

return super.getServletInfo();

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:52:43)

* @return int

* @param request javax.servlet.http.HttpServletRequest

* @param name java.lang.String

* @param required boolean

* @param defValue int

*/

public static java.sql.Timestamp getTimestampParameter(HttpServletRequest request, String name, boolean required, java.sql.Timestamp defValue) throws ServletException{

String value = getParameter(request,name,required,String.valueOf(defValue));

return java.sql.Timestamp.valueOf(value);

}

/**

* Initializes the servlet.

*/

public void init() {

// insert code to initialize the servlet here

}

/**

* Process incoming requests for information

*

* @param request Object that encapsulates the request to the servlet

* @param response Object that encapsulates the response from the servlet

*/

public void performTask(HttpServletRequest request, HttpServletResponse response) {

try

{

// Insert user code from here.

}

catch(Throwable theException)

{

// uncomment the following line when unexpected exceptions

// are occuring to aid in debugging the problem.

//theException.printStackTrace();

}

}

/**

* Insert the method´s description here.

* Creation date: (2001-2-5 8:31:54)

* @param request javax.servlet.ServletRequest

* @param response javax.servlet.ServletResponse

* @exception javax.servlet.ServletException The exception description.

* @exception java.io.IOException The exception description.

*/

public void service(ServletRequest request, ServletResponse response) throws javax.servlet.ServletException, java.io.IOException {

String content = request.getContentType();

if(content == null || content != null && content.toLowerCase().startsWith("application/x-www-form-urlencoded"))

request.setAttribute(PARAMS_ATTR_NAME,new UTF8ParameterReader((HttpServletRequest)request));

super.service(request,response);

}

}

這個就是Servlet基類,它覆蓋了父類的service方法,在調用父類service前,建立了UTF8ParameterReader對象,其中儲存了form中提交的資訊。然後把這個對象作為一個Attribute儲存到Request對象中。然後照樣調用父類的service方法。

對於繼承這個類的Servlet,要注意的是,"標準"getParameter在也不能讀到post的資料,因為在這之前這個類中已經從ServletInputStream中讀出了資料了。所以應該使用該類中提供的getParameter方法。

剩下的就是輸出問題了,我們要把輸出的資訊,轉為UTF8的二進位流輸出。只要我們設定Content-Type時指定charset為UTF8,然後使用PrintWriter輸出,那麼這些轉換是自動進行的,Servlet中這樣設定:

response.setContentType("text/html;charset=UTF8");

Jsp中這樣設定:

<%@ page contentType="text/html;charset=UTF8"%>

這樣就可以保證輸出是UTF8流,用戶端能否顯示,就看用戶端的了。

對於multipart/form-data的form提交的內容,我也提供一個類用來處理,在這個類的構造子中可以指定頁面使用的charset,預設還是UTF-8,限於篇幅不貼出源碼。



相關文章

Beyond APAC's No.1 Cloud

19.6% IaaS Market Share in Asia Pacific - Gartner IT Service report, 2018

Learn more >

Apsara Conference 2019

The Rise of Data Intelligence, September 25th - 27th, Hangzhou, China

Learn more >

Alibaba Cloud Free Trial

Learn and experience the power of Alibaba Cloud with a free trial worth $300-1200 USD

Learn more >

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。