(1)前言:
解決web程式的國際化問題,必須在任何地方使用UTF-8對字元進行編碼。(包括:資料庫設定為:UTF-8,web頁面也要設定為:UTF-8)
這樣做的好處在於可以解決在web上不止中文字元編碼問題,所有的字元編碼都統一使用UTF-8,實現了語言的國際化。同時在儲存資料到
資料庫時候也省去了編碼轉換的問題。
在JSP或JSF應用中使用到Servlet,我們通過使用Servlet過濾器進行編碼轉換,也就是制定編碼轉換為UFT-8。
(2)Servlet和JSP過濾器Filter簡介:
servlet API的2.3版本中最重要的一個新功能就是能夠為servlet和JSP頁面定義過濾器。過濾器提供了某些早期伺服器所支援的非標準“servlet連結”的一種功能強大且標準的替代品。
過濾器是一個程式,它先於與之相關的servlet或JSP頁面運行在伺服器上。過濾器可附加到一個或多個servlet或JSP頁面上,並且可以檢查進入這些資源的請求資訊。在這之後,過濾器可以作如下的選擇:
- 以常規的方式調用資源(即,調用servlet或JSP頁面)。
- 利用修改過的請求資訊調用資源。
- 調用資源,但在發送響應到客戶機前對其進行修改
- 阻止該資源調用,代之以轉到其他的資源,返回一個特定的狀態碼或產生替換輸出。
過濾器提供了幾個重要好處。
首先,它以一種模組化的或可重用的方式封裝公用的行為。你有30個不同的serlvet或JSP頁面,需要壓縮它們的內容以減少下載時間嗎?沒問題:構造一個壓縮過濾器(參閱第11節),然後將它應用到30個資源上即可。
其次,利用它能夠將進階訪問決策與表現代碼相分離。這對於JSP特別有價值,其中一般希望將幾乎整個頁面集中在表現上,而不是集中在商務邏輯上。例如,希 望阻塞來自某些網站的訪問而不用修改各頁面(這些頁面受到訪問限制)嗎?沒問題:建立一個訪問限制過濾器(參閱第8節)並把它應用到想要限制訪問的頁面上 即可。
最後,過濾器使你能夠對許多不同的資源進行批量性的更改。你有許多現存資源,這些資源除了公司名要更改外其他的保持不變,能辦到嗎?沒問題:構造一個串替換過濾器(參閱第10節),只要合適就使用它。
但要注意,過濾器只在與servlet規範2.3版相容的伺服器上有作用。如果你的Web應用需要支援舊版伺服器,就不能使用過濾器。
建立一個過濾器涉及下列五個步驟:
1、建立一個實現Filter介面的類。這個類需要三個方法,分別是:doFilter、init和destroy。doFilter方法包含主要的過濾代碼,init方法建立設定作業,而destroy方法進行清楚。
2、 在doFilter方法中放入過濾行為。doFilter方法的第一個參數為ServletRequest對象。此對象給過濾器提供了對進入的資訊(包括 表單資料、cookie和HTTP要求標頭)的完全訪問。第二個參數為ServletResponse,通常在簡單的過濾器中忽略此參數。最後一個參數為 FilterChain,如下一步所述,此參數用來調用servlet或JSP頁。
3、調用FilterChain對象的doFilter方法。 Filter介面的doFilter方法取一個FilterChain對象作為它的一個參數。在調用此對象的doFilter方法時,啟用下一個相關的過 濾器。如果沒有另一個過濾器與servlet或JSP頁面關聯,則servlet或JSP頁面被啟用。
4、對相應的servlet和JSP頁面註冊過濾器。在部署描述符檔案(web.xml)中使用filter和filter-mapping元素。
5、禁用啟用器servlet。防止使用者利用預設servlet URL繞過過濾器設定。
doFilter方法:
public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)
throws ServletException, IOException
{
HttpServletRequest req = (HttpServletRequest)request;
System.out.println(req.getRemoteHost() + " tried to access " +req.getRequestURL() +" on " + new Date() + ".");
chain.doFilter(request,response);
}
在web.xml中進行部署
分別是:filter和filter-mapping。filter元素向系統註冊一個過濾對象,filter-mapping元素指定該過濾對象所應用的URL。
1.filter元素
filter元素位於部署描述符檔案(web.xml)的前部,所有filter-mapping、servlet或servlet-mapping元素之前。filter元素具有如下六個可能的子項目:
:icon 這是一個可選的元素,它聲明IDE能夠使用的一個圖象檔案。
:filter-name 這是一個必需的元素,它給過濾器分配一個選定的名字。
:display-name 這是一個可選的元素,它給出IDE使用的簡短名稱。
:description 這也是一個可選的元素,它給出IDE的資訊,提供文字文件。
:filter-class 這是一個必需的元素,它指定過濾器實作類別的完全限定名。
:init-param 這是一個可選的元素,它定義可利用FilterConfig的getInitParameter方法讀取的初始化參數。單個過濾器元素可包含多個init-param元素。
2.filter-mapping元素
filter-mapping元素位於web.xml檔案中filter元素之後serlvet元素之前。它包含如下三個可能的子項目::
:filter-name 這個必需的元素必須與用filter元素宣告時給予過濾器的名稱相匹配。
:url-pattern 此元素宣告一個以斜杠(/)開始的模式,它指定過濾器應用的URL。所有filter-mapping元素中必須提供url-pattern或 servlet-name。但不能對單個filter-mapping元素提供多個url-pattern元素項。如果希望過濾器適用於多個模式,可重複 整個filter-mapping元素。
:servlet-name 此元素給出一個名稱,此名稱必須與利用servlet元素給予servlet或JSP頁面的名稱相匹配。不能給單個filter-mapping元素提供 多個servlet-name元素項。如果希望過濾器適合於多個servlet名,可重複這個filter-mapping元素。
(3)在Rational Application Developer 中的建立字元轉換過濾器:
1.建立-web-過濾器:SetCharacterEncodingFilter
會在web.xml中產生如下代碼:
<filter>
<filter-name>ChangeCodeFilter</filter-name>
<display-name>ChangeCodeFilter</display-name>
<description></description>
<filter-class>com.cnc.SetCharacterEncodingFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<url-pattern>/SetCharacterEncodingFilter</url-pattern>
</filter-mapping>
2.在過濾器的doFilter方法中添加如下代碼:
public void doFilter(ServletRequest arg0, ServletResponse arg1,FilterChain arg2) throws IOException, ServletException {
arg0.setCharacterEncoding("UTF-8"); //設定字型編碼為UTF-8
arg2.doFilter(arg0, arg1);// 傳遞控制到下一個過濾器
}
3.在web.xml中進行部署
在web.xml的過濾器-編輯器中選擇:servlet 映射 - 添加 - Faces Servlet
會在web.xml中產生如下代碼:
<filter-mapping>
<filter-name>SetCharacterEncodingFilter</filter-name>
<servlet-name>Faces Servlet</servlet-name>
</filter-mapping>
(4)其他參考資訊
tomcat下中文的徹底解決
(一) JSP頁面上是中文,但是看的是後是亂碼:
解 決的辦法就是在JSP頁面的編碼的地方<%@ page language="java" contentType="text/html;charset=GBK" %>,因為Jsp轉成Java檔案時的編碼問題,預設的話有的伺服器是ISO-8859-1,如果一個JSP中直接輸入了中文,Jsp把它當作 ISO8859-1來處理是肯定有問題的,這一點,我們可以通過查看Jasper所產生的Java中間檔案來確認
(二) 當用Request對象擷取客戶提交的漢字代碼的時候,會出現亂碼:
解決的辦法是:要配置一個filter,也就是一個Servelet的過濾器,代碼如下:
import java.io.IOException;
import javax.servlet.Filter;
import javax.servlet.FilterChain;
import javax.servlet.FilterConfig;
import javax.servlet.ServletException;
import javax.servlet.ServletRequest;
import javax.servlet.ServletResponse;
import javax.servlet.UnavailableException;
/**
* Example filter that sets the character encoding to be used in parsing the
* incoming request
*/
public class SetCharacterEncodingFilter implements Filter {
/**
* Take this filter out of service.
*/
public void destroy() {
}
/**
* Select and set (if specified) the character encoding to be used to
* interpret request parameters for this request.
*/
public void doFilter(ServletRequest request, ServletResponse response,
FilterChain chain)throws IOException, ServletException {
request.setCharacterEncoding("GBK");
// 傳遞控制到下一個過濾器
chain.doFilter(request, response);
}
public void init(FilterConfig filterConfig) throws ServletException {
}
}
配置web.xml
<filter>
<filter-name>Set Character Encoding</filter-name>
<filter-class>SetCharacterEncodingFilter</filter-class>
</filter>
<filter-mapping>
<filter-name>Set Character Encoding</filter-name>
<url-pattern>/*</url-pattern>
</filter-mapping>
如果你的還是出現這種情況的話你就往下看看是不是你出現了第四中情況,你的Form提交的資料是不是用get提交的,一般來說用post提交的話是沒有問題的,如果是的話,你就看看第四中解決的辦法。
還有就是對含有漢字字元的資訊進行處理,處理的代碼是:
package dbJavaBean;
public class CodingConvert
{
public CodingConvert()
{
//
}
public String toGb(String uniStr){
String gbStr = "";
if(uniStr == null){
uniStr = "";
}
try{
byte[] tempByte = uniStr.getBytes("ISO8859_1");
gbStr = new String(tempByte,"GB2312");
}
catch(Exception ex){
}
return gbStr;
}
public String toUni(String gbStr){
String uniStr = "";
if(gbStr == null){
gbStr = "";
}
try{
byte[] tempByte = gbStr.getBytes("GB2312");
uniStr = new String(tempByte,"ISO8859_1");
}catch(Exception ex){
}
return uniStr;
}
}
你也可以在直接的轉換,首先你將擷取的字串用ISO-8859-1進行編碼,然後將這個編碼存放到一個位元組數組中,然後將這個數組轉化成字串對象就可以了,例如:
String str=request.getParameter(“girl”);
Byte B[]=str.getBytes(“ISO-8859-1”);
Str=new String(B);
通過上述轉換的話,提交的任何資訊都能正確的顯示。
(三) 在Formget請求在服務端用request. getParameter(“name”)時返回的是亂碼;按tomcat的做法設定Filter也沒有用或者用 request.setCharacterEncoding("GBK");也不管用問題是出在處理參數傳遞的方法上:如果在servlet中用 doGet(HttpServletRequest request, HttpServletResponse response)方法進行處理的話前面即使是寫了:
request.setCharacterEncoding("GBK");
response.setContentType("text/html;charset=GBK");
也是不起作用的,返回的中文還是亂碼!!!如果把這個函數改成doPost(HttpServletRequest request, HttpServletResponse response)一切就OK了。
同樣,在用兩個JSP頁面處理表單輸入之所以能顯示中文是因為用的是post方法傳遞的,改成get方法依舊不行。
由此可見在servlet中用doGet()方法或是在JSP中用get方法進行處理要注意。這畢竟涉及到要通過瀏覽器傳遞參數資訊,很有可能引起常用字元集的衝突或是不匹配。
解決的辦法是:
1) 開啟tomcat的server.xml檔案,找到區塊,加入如下一行:
URIEncoding=”GBK”
完整的應如下:
<Connector port="8080" maxThreads="150" minSpareThreads="25" maxSpareThreads="75" enableLookups="false" redirectPort="8443" acceptCount="100" debug="0" connectionTimeout="20000" disableUploadTimeout="true" URIEncoding="GBK"/>
2)重啟tomcat,一切OK。
需要加入的原因大家可以去研究 $TOMCAT_HOME/webapps/tomcat-docs/config/http.html下的這個檔案就可以知道原因了。需要注意的是:這 個地方如果你要是用UTF-8的時候在傳遞的過程中在Tomcat中也是要出現亂碼的情況,如果不行的話就換別的字元集。
(四) JSP頁面上有中文,按鈕上面也有中文,但是通過伺服器查看頁面的時候出現亂碼:
解決的辦法是:首先在JSP檔案中不應該直接包含本地化的訊息文本,而是應該通過<bean:message>標籤從Resource Bundle中獲得文本。應該把你的中文文本放到Application.properties檔案中,這個檔案放在WEB-INF/classes/* 下,例如我在頁面裡有姓名,年齡兩個label,我首先就是要建一個Application.properties,裡面的內容應該是name=”姓名” age=”年齡”,然後我把這個檔案放到WEB-INF/classes/properties/下,接下來根據
Application.properties檔案,對他進行編碼轉化,建立一個中文資源檔,假定名字是 Application_cn.properties。在JDK中提供了native2ascii命令,他能夠實現字元編碼的轉換。在DOS環境中找到你 放置Application.properties的這個檔案的目錄,在DOS環境中執行一下命令,將產生按GBK編碼的中文資源檔 Application_cn.properties:native2ascii ?encoding gbk Application.properties
Application_cn.properties執行以上命令以後將產生如下內容的Application_cn.properties檔案: name=\u59d3\u540d age=\u5e74\u9f84,在Struts-config.xml中配置:<message-resources parameter="properties.Application_cn"/>。到這一步,基本上完成了一大半,接著你就要在JSP頁面上寫 <%@ page language="java" contentType="text/html;charset=GBK"
%>,到名字的那個label是要寫<bean:message key=”name”>,這樣的化在頁面上出現的時候就會出現中文的姓名,年齡這個也是一樣,按鈕上漢字的處理也是同樣的。
(五) 寫入到資料庫是亂碼:
解決的方法:要配置一個filter,也就是一個Servelet的過濾器,代碼如同第二種時候一樣。
如果你是通過JDBC直接連結資料庫的時候,配置的代碼如下:jdbc:mysql://localhost:3306/workshopdb?useUnicode=true&characterEncoding=GBK,這樣保證到資料庫中的代碼是不是亂碼。
如 果你是通過資料來源連結的化你不能按照這樣的寫法了,首先你就要寫在設定檔中,在tomcat 5.0.19中配置資料來源的地方是在C:\Tomcat 5.0\conf\Catalina\localhost這個下面,我建立的工程是workshop,放置的目錄是webapp下面, workshop.xml的設定檔如下:
<!-- insert this Context element into server.xml -->
<Context path="/workshop" docBase="workshop" debug="0"
reloadable="true" >
<Resource name="jdbc/WorkshopDB"
auth="Container"
type="javax.sql.DataSource" />
<ResourceParams name="jdbc/WorkshopDB">
<parameter>
<name>factory</name>
<value>org.apache.commons.dbcp.BasicDataSourceFactory</value>
</parameter>
<parameter>
<name>maxActive</name>
<value>100</value>
</parameter>
<parameter>
<name>maxIdle</name>
<value>30</value>
</parameter>
<parameter>
<name>maxWait</name>
<value>10000</value>
</parameter>
<parameter>
<name>username</name>
<value>root</value>
</parameter>
<parameter>
<name>password</name>
<value></value>
</parameter>
<!-- Class name for mm.mysql JDBC driver -->
<parameter>
<name>driverClassName</name>
<value>com.mysql.jdbc.Driver</value>
</parameter>
<parameter>
<name>url</name>
<value><![CDATA[jdbc:mysql://localhost:3306/workshopdb?useUnicode=true&characterEncoding=GBK]]></value>
</parameter>
</ResourceParams>
</Context>
粗 體的地方要特別的注意,和JDBC直接連結的時候是有區別的,如果你是配置正確的化,當你輸入中文的時候到資料庫中就是中文了,有一點要注意的是你在顯示 資料的頁面也是要用<%@ page language="java" contentType="text/html;charset=GBK" %>這行代碼的。需要注意的是有的前台的人員在寫代碼的是後用Dreamver寫的,寫了一個Form的時候把他改成了一個jsp,這樣有一個地方 要注意了,那就是在Dreamver中Action的提交方式是request的,你需要把他該過來,因為在jsp的提交的過程中緊緊就是POST和
GET兩種方式,但是這兩種方式提交的代碼在編碼方面還是有很大不同的,這個在後面的地方進行說明。
來自:
http://hi.baidu.com/kayzombie/blog/item/63e664647d9262f8f7365495.html