Tomcat+Jsp環境下的中文問題
來源:互聯網
上載者:User
js|問題|中文 摘要:關於Java應用在處理中文時所存在問題的討論已經相當多了,與大部分的討論不同,本文將從漢字字元的輸入和輸出的角度來討論Java語言處理中文時所存在的問題。
儘管關於Java在處理中文字元時所存在的問題的討論已不乏其數,但由於Java技術涉及內容廣(J2EE包含了十幾種相關技術),技術供應商繁多,面向Java的Web伺服器、應用伺服器以及JDBC資料庫驅動等都沒有官方的標準,所以Java應用在處理中文時出了存在固有的問題外也會隨著選用的伺服器、驅動程式的不同產生一些與平台相關的問題。也就是說,在處理中文問題時,Java代碼的可移植性打了折扣。
總的看來,Java的中文處理問題較為集中地出現在JSP技術應用和Java的資料庫訪問過程中。這是因為無論是JSP應用還是基於JDBC的資料庫訪問都涉及到了Java程式與另外一種應用系統的互動,這種互動不可避免的要求系統之間進行資料的互動和參數的傳遞,而Java處理中文出現問題的地方往往就是這些資料讀入和輸出的地方。
JSP程式所應該注意的中文問題
以Tomcat 3.2.1的JSP應用為例,一般遇到中文問題可以使用如下的編碼強制轉換函式進行內碼的轉換。
public static String toChinese(String strvalue)
{
try{
if(strvalue==null)
return null;
else
{
strvalue = new String(strvalue.getBytes("ISO8859_1"), "GBK");
return strvalue;
}
}catch(Exception e){
return null;
}
}
注意,在使用該函數前,我們需要分析中文無法正確輸出的原因到底是什麼,而不能將所有的中文處理的問題都用這個方法來解決。例如,如果是由於忘記將JSP的輸出代碼定義為GB2312或GBK而產生的中文無法正確輸出就不能用這個函數來解決。一個好的習慣是在我們編寫每一個JSP頁面時都在檔案的第一行定義程式所要輸出的字元集,如
<%@ page contentType="text/html; charset=GBK" %>或
<%@ page contentType="text/html; charset=GB2312" %>
對於一些不支援定義輸出的字元集的JSP版本,我們也可以作如下的設定:
<META HTTP-EQUIV="Content-Type" CONTENT="text/html; charset=gb2312">
另外還需要注意的是,這個函數是用來解決那些確實出現了無法正確輸出中文的代碼,而不是一個通用的用來保證中文字元正確輸出的函數。由於中文字元無法正確的輸出或讀入的原因都是因為這個字元的編碼和系統預設的字元集編碼(或者是應用所要輸出的字元集,二者一般情況下是相同的)的不同引起的,所以在應用該函數前我們必須確定我們所要讀入或輸出的字元的編碼到底與系統預設的字元集編碼是否相同。