JSP中幾處編碼設定的作用及區別(整理版)__編碼

來源:互聯網
上載者:User

1、page命令中的pageEncoding:

 

設定JSP編譯成Servlet時,讀取JSP時使用的編碼。通常,在JSP內部定義的字串(直接在JSP中定義,而不是從瀏覽器提交的資料)出現亂碼時,很多都是由於該參數設定錯誤引起的。只能用於JSP中。

 

另外,當沒有設定page命令contentType和response.setCharacterEncoding方法時,它也指定了對伺服器響應進行重新編碼的編碼格式。

 

實際上,伺服器在發送資料時,編碼方式是採用response.setCharacterEncoding—contentType—pageEncoding的優先順序。

 

2、page命令中的contentType:

 

指定對伺服器響應進行重新編碼時採用的編碼格式。只能用於JSP中。

 

另外,當沒有設定response.setCharacterEncoding方法時,它也指定了對伺服器響應進行重新編碼的編碼格式。

 

3、request.setCharacterEncoding:

指定對用戶端請求進行編碼的編碼格式。即對從瀏覽器端發送過來的資料進行編碼時,所採用的編碼格式。可用於JSP和Servlet。

 

4、response.setCharacterEncoding:

 

指定對伺服器響應進行重新編碼時採用的編碼格式。即在伺服器將資料發往瀏覽器之前,會先進行編碼,此時就是採用它。可用於JSP和Servlet。

 

另外,瀏覽器在接受和發送資料時,採用的編碼也均是response.setCharacterEncoding中設定的編碼格式。也就是稱為“瀏覽器編碼”。

 

---------------------------------------------------------------------------------------------------------------------------------

 

一、實際的互動過程中,JSP進行了兩次“編碼”:

 

在JSP轉成Servlet時,先採用pageEncoding中指定的編碼來讀取,然後由指定的編碼方案將其轉成統一UTF-8格式的java源碼,也就是Servlet;

 

Servlet實際也就是.java檔案,它再被以UTF-8編碼轉成.class檔案,即Java byteCode。

 

伺服器載入這些Java byteCode,然後就採用contentType中設定的編碼格式將其轉換後再返回給用戶端,即瀏覽器中所見內容。

 

二、伺服器在發送資料時,編碼方式是採用response.setCharacterEncoding—contentType—pageEncoding的優先順序;

 

而伺服器在接受資料時,存在三種情況:瀏覽器直接用URL提交資料、表單用get或post方式提交資料;

 

因為各種WEB伺服器對這三種方式的處理也不相同,所以我們以Tomcat5.0為例。
    

無論使用那種方式提交,如果參數中包含中文,瀏覽器都會使用當前瀏覽器編碼對其進行URL編碼。


1、對於表單中POST方式提交的資料,只要在接收資料的JSP中正確request.setCharacterEncoding參數,即將對用戶端請求進行重新編碼的編碼設定成瀏覽器編碼,就可以保證得到的參數編碼正確。而在預設請情況下,瀏覽器編碼就是你在響應該請求的JSP頁面中response.setCharacterEncoding設定的值。所以,對於POST表單提交的資料,在獲得資料的 JSP頁面中request.setCharacterEncoding要和產生提交該表單的JSP頁面的 response.setCharacterEncoding設定成相同的值。

 

2、對於URL提交的資料和表單中GET方式提交的資料,在接收資料的JSP中設定request.setCharacterEncoding參數是不行的,因為在Tomcat5.0中,預設情況下使用ISO- 8859-1對URL提交的資料和表單中GET方式提交的資料進行重新編碼(解碼),而不使用該參數對URL提交的資料和表單中GET方式提交的資料進行重新編碼(解碼)。要解決該問題,應該在Tomcat的設定檔的Connector標籤中設定useBodyEncodingForURI或者URIEncoding屬性,其中

 

useBodyEncodingForURI參數表示是否用request.setCharacterEncoding 參數對URL提交的資料和表單中GET方式提交的資料進行重新編碼,在預設情況下,該參數為false(Tomcat4.0中該參數預設為 true);

 

URIEncoding參數指定對所有GET方式請求(包括URL提交的資料和表單中GET方式提交的資料)進行統一的重新編碼(解碼)的編碼。

 

URIEncoding和useBodyEncodingForURI區別是,URIEncoding是對所有GET方式的請求的資料進行統一的重新編碼(解碼),而useBodyEncodingForURI則是根據響應該請求的頁面的request.setCharacterEncoding參數對資料進行的重新編碼(解碼),不同的頁面可以有不同的重新編碼(解碼)的編碼。所以對於URL提交的資料和表單中GET方式提交的資料,可以修改 URIEncoding參數為瀏覽器編碼或者修改useBodyEncodingForURI為true,並且在獲得資料的JSP頁面中 request.setCharacterEncoding參數設定成瀏覽器編碼。


下面總結下,以Tomcat5.0為WEB伺服器時,如何防止中文亂碼。
1、對於同一個應用,最好統一編碼,推薦為UTF-8,當然GBK也可以。
2、正確設定JSP的pageEncoding參數
3、在所有的JSP/Servlet中設定contentType="text/html;charset=UTF-8"或response.setCharacterEncoding("UTF-8"),從而間接實現對瀏覽器編碼的設定。
4、 對於請求,可以使用過濾器或者在每個JSP/Servlet中設定request.setCharacterEncoding("UTF-8")。同時,要修改Tomcat的預設配置,推薦將useBodyEncodingForURI參數設定為true,也可以將URIEncoding參數設定為 UTF-8(有可能影響其他應用,所以不推薦)。

 

轉載原文:

http://hi.baidu.com/encodinglife/blog/item/5d1655091380c2a72fddd4dc.html

 

http://www.showweb.cn/program/JSP/4450.html

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.