(轉載)關於JSP和Servlet亂碼處理

來源:互聯網
上載者:User

標籤:blog   http   java   使用   os   strong   io   檔案   

JSP和Servlet的中文亂碼處理

前幾天學習了JSP和Servlet中有關中文亂碼的一些問題,寫成了部落格,今天進行更新一下。應該是可以解決日常的亂碼問題了。現在作以下總結希望對需要的人有所協助。我也是剛學,所以有不足之處希望諒解。

一、表單提交時出現亂碼:

在進行表單提交的時候,經常提交一些中文,自然就避免不了出現中文亂碼的情況,對於表單來說有兩種提交方式:get和post提交方式。所以請求的時候便有get請求和post請求。以前我一直以為get請求和post請求方式出現的亂碼的解決方式是一樣的,但是今天才知道兩種請求方式所產生的亂碼的解決方式是不同的。每種方式都有著不同的解決方案,之所以出現亂碼,原因就在於get請求時,其傳遞給伺服器的資料是附加在URL地址之後的;而post的請求時,其傳遞給伺服器的資料是作為請求體的一部分傳遞給伺服器。這也就導致了對它們所產生的亂碼的處理方式是不同的。

1、用戶端的get請求

對於不同的請求方式,解決亂碼的問題也是不一樣的,對於用戶端的get請求來說,伺服器端處理要想不出現亂碼,解決這個問題稍微複雜一些,需要用到String類型的建構函式,其中的一個建構函式就是用指定的編碼方式去解碼,一般都用“UTF-8”的方式。只要在伺服器端將請求得到的參數重新構造成一個字串就行了。如下所示:

String  stuname = request.getParameter("stuname");

String str = new String(stuname.getBytes("ISO-8859-1"),"utf-8")

經過構造之後,用戶端輸入中文,且表單時get請求的情況下,str就變成了中文了。如果請求參數比較多,最好將它封裝成一個工具類:

public class MyUtil

{

    public static String getNewString(String str) throws UnsupportedEncodingException

    {

       return new String(str.getBytes("ISO-8859-1"),"UTF-8");

    }

}

String stuname= MyUtil.getNewString(request.getParameter("stuname"));

2、用戶端的post請求

對於用戶端的post請求來說,處理亂碼的問題就比較簡單了,因為請求的資料時作為請求體的一部分傳遞給伺服器的,所以只要修改請求內的編碼就行了。只要在伺服器端的最開始處將請求的資料設定為“UTF-8”就行了,輸入如下語句:

request. setCharacterEncoding(“UTF-8”);

這樣使用者在伺服器端擷取到的中文資料就不再是亂碼了。

二、超連結時出現亂碼(低版本瀏覽器不行IE6)

在Web開發中,挺多的時候都是通過超連結去傳遞中文參數的,這也會導致在顯示的時候也會出現亂碼,對於超連結來說,它實際上是向伺服器端發送了一個請求,而它發出的請求是屬於get請求,所以對於超連結的亂碼來說,它處理亂碼的方式和表單的get請求出現亂碼的方式是一樣的。

String stuname= MyUtil.getNewString(request.getParameter("stuname"));

三、重新導向時出現亂碼(低版本瀏覽器不行IE6)

有時寫上response的sendRedirect()方法進行重新導向時也會出現亂碼,重新導向時實際上也是向伺服器發送了一個請求,所以解決亂碼的方法和和上面是一樣的。

四、瀏覽器版本低導致的亂碼

上網的時候,有時提交的一些資訊在地址欄顯示的是“%2C%C6%CC%C6”的字樣,其實這都是防止出現亂碼進行的解決方案,如果你的瀏覽器是IE6或以下版本,則我們的第二種情況和第三種情況會出現亂碼(尤其是當中文是奇數的時候),這就不好使了所以我們必須採用另一種比較實際的作法:

在java.net包中提供了URLEncoder類和URLDcoder類,這兩個類又分別提供了encode和decode兩個靜態方法,分別用於進行編碼和解碼。我們將要傳遞的中文參數進行編碼之後,在傳遞給伺服器,伺服器解碼之後,就可以顯示中文了。

進行編碼:URLEncoder.encode(stuname,”UTF-8”)

傳遞給伺服器:<a href=”/1.jsp?stuname<%=stuname%>”>傳遞</a>

進行解碼:URLDecoder.decode(stuname,”UTF-8”);

這樣就可以得到傳遞過來的中文參數了,我發現許多網站用的都是這種方式解決中參數的。

五、返回瀏覽器顯示的亂碼

在Servlet編程中,經常需要通過response對象將一些資訊返回給瀏覽器,給我們的用戶端,而我們在伺服器端顯示的中文,但是響應給用戶端瀏覽器卻是亂碼,這主要是由於response對象的getWriter()方法返回的PrintWriter對象預設使用“ISO-8859-1”字元集編碼進行Unicode字串到位元組數組的轉換,由於ISO8859-1字元集中根本就沒有包含中文字元,所以Java在進行轉換的時候會將無效的字元編碼輸出給用戶端,於是便出現了亂碼,為此ServletResponse介面中便定義了setCharacterEncoding、setContentType等方法來指定getWriter方法返回的PrintWriter對象所使用的字元集編碼,所以我們在寫Servlet程式中,在調用getWriter方法之前設定這些方法的值。我們為了防止亂碼,經常將以下兩條語句一起寫上:

response.setContentType(“text/html;charset=utf-8”);

response. setCharacterEncoding(“UTF-8”);

只要編寫Servlet檔案中含有響應給用戶端的資訊,那麼就要寫上這兩句話。最好寫上第二句話,因為它的優先順序高,它的設定結果將覆蓋setContentType等方法設定的字元編碼集。

六、修改Tomcat的編碼

在上述的get請求所導致亂碼問題中,還有一種解決的方案,我們常用Tomcat作為運行Servlet和JSP的容器,而Tomcat內部預設的編碼是ISO-8859-1,所以對於get請求方式,其傳遞的資料(URI)會附加在訪問的資源後面,其編碼是Tomcat預設的,如果修改該URI的編碼,那麼對於所有的get請求方式便不會出現亂碼了包括上邊說的重新導向和超連結,在Tomcat的設定檔server.xml中找到修改Tomcat的連接埠的地方,在其內部加入URIEncoding屬性,設定為和你的項目中所設的編碼一樣的值,這裡全部都是UTF-8。如下所示:

<Connector port="8080" protocol="HTTP/1.1" connectionTimeout="20000"redirectPort="8443"  URIEncoding="UTF-8"/>

七、使用MySQL資料庫亂碼

有時會用JDBC串連MySQL資料庫,可能會出現亂碼,所以要在串連之後加上如下的語句:

useUnicode=true&characterEncoding=UTF-8
這樣就可以解決亂碼問題了。

在編寫Servlet和JSP的時候,為了避免出現亂碼,最重要的就是:採用一致的編碼,如果編碼都一致了,肯定不會出現亂碼。如果出現了亂碼肯定那個地方不一致了。

原文:http://blog.csdn.net/longyuhome/article/details/7856270

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.