get跟post編碼--轉

最後更新：2015-11-19 來源：互聯網

上載者：User

創建阿里雲帳戶，並獲得超過 40 款產品的免費試用版；而企業帳戶則可以享有總值 $1200 的免費試用版。立即註冊！

標籤：

1、Get是用來從伺服器上獲得資料(沒有請求體)，而Post是用來向伺服器上傳遞資料(包含請求體)。

2、Get將表單中資料的按照variable=value的形式，添加到action（服務）所指向的URL後面，並且兩者使用“?”串連，而各個變數之間使用“&”串連；Post是將表單中的資料放在form的資料體中，按照變數和值相對應的方式，傳遞到action所指向URL。

3、Get是不安全的，因為在傳輸過程，資料被放在請求的URL中，而如今現有的很多伺服器、Proxy 伺服器或者使用者代理程式都會將請求URL記錄到記錄檔中，然後放在某個地方，這樣就可能會有一些隱私的資訊被第三方看到。另外，使用者也可以在瀏覽器上直接看到提交的資料，一些系統內部訊息將會一同顯示在使用者面前。Post的所有操作對使用者來說都是不可見的。

4、Get傳輸的資料量小，因為受URL長度限制；Post可以傳輸大量的資料，所以在上傳檔案只能使用Post（當然還有一個原因，將在後面的提到）。

5、Get限制Form表單的資料集的值必須為ASCII字元；而Post支援整個ISO10646字元集。預設是用ISO-8859-1編碼

6、Get是Form的預設方法。

這篇文章是我長時間和亂碼做鬥爭的一些理解的積累，還希望有更多的朋友給出指點和補充。

form有2種方法把資料提交給伺服器，get和post,分別說：

get

1.用戶端（瀏覽器）編碼

對於get方法來說，都是把資料串聯在請求的url後面作為參數，如：http://localhost:8080/servlet?msg=abc。如果url中出現中文或其它特殊字元的話，如：http://localhost:8080 /servlet?msg=杭州，瀏覽器會對url進行URL encode，然後發送給伺服器。URL encode的過程就是把部分url做為字元，按照某種編碼方式（如：utf-8,gbk等）編碼成二進位的位元組碼，然後每個位元組用一個包含3個字元的字串 "%xy" 表示，其中xy為該位元組的兩位十六進位表示形式，具體介紹可以看下java.net.URLEncoder類，我們能看到2個很重要的問題：

第一：需要URL encode的字元一般都是非ASCII的字元（籠統的講），再通俗的講就是除了英文字母以外的文字（如：中文，日文等）都要進行URL encode，所以對於我們來說，都是英文字母的url不會出現伺服器得到亂碼問題，出現亂碼都是url裡面帶了中文或特殊字元造成的；

第二：URL encode到底按照那種編碼方式對字元編碼？這裡就是瀏覽器的事情了，而且不同的瀏覽器有不同的做法，中文版的瀏覽器一般會預設的使用GBK，通過設定瀏覽器也可以使用UTF-8，可能不同的使用者就有不同的瀏覽器設定，也就造成不同的編碼方式，所以很多網站的做法都是先把url裡面的中文或特殊字元用 javascript做URL encode，然後再拼接url提交資料，也就是替瀏覽器做了URL encode，好處就是網站可以統一get方法提交資料的編碼方式。

完成了URL encode，那麼現在的url就成了ASCII範圍內的字元了，然後以iso-8859-1的編碼方式轉換成二進位隨著要求標頭一起發送出去。這裡想多說幾句的是，對於get方法來說，沒有請求實體，含有資料的url都在要求標頭裡面，之所以用URL encode，我個人覺的原因是：對於要求標頭來說最終都是要用iso-8859-1編碼方式編碼成二進位的101010.....的純資料在互連網上傳送，如果直接將含有中文等特殊字元做iso-8859-1編碼會丟失資訊，所以先做URL encode是有必要的。

2.伺服器端解碼

第一步是先把資料用iso-8859-1進行解碼，對於get方法來說，tomcat擷取資料的是ASCII範圍內的要求標頭字元，其中的請求url裡面帶有參數資料，如果參數中有中文等特殊字元，那麼目前還是URL encode後的%XY狀態，先停下，我們先說下開發人員一般擷取資料的過程。通常大家都是request.getParameter("name")擷取參數資料，我們在request對象或得的資料都是經過解碼過的，而解碼過程中程式裡是無法指定，這裡要說下，有很多新手說用 request.setCharacterEncoding("字元集")可以指定解碼方式，其實是不可以的，看servlet的官方API說明有對此方法的解釋：Overrides the name of the character encoding used in the body of this request. This method must be called prior to reading request parameters or reading input using getReader().可以看出對於get方法他是無能為力的。那麼到底用什麼編碼方式解碼資料的呢，這是tomcat的事情了，預設預設用的是 iso-8859-1,這樣我們就能找到為什麼get請求帶中文參數為什麼在伺服器端得到亂碼了，原因是在用戶端一般都是用UTF-8或GBK對資料 URL encode，這裡用iso-8859-1方式URL decoder顯然不行，在程式裡我們可以直接這樣：

[java] view plaincopy

new String(request.getParameter("name").getBytes("iso-8859-1"),"用戶端指定的URL encode編碼方式")

還原回位元組碼，然後用正確的方式解碼資料，網上的文章通常是在tomcat裡面做個配置Xml代碼：

[html] view plaincopy

<Connector port="8080" protocol="HTTP/1.1" maxThreads="150" connectionTimeout="20000" redirectPort="8443" URIEncoding="GBK"/>

這樣是讓tomcat在擷取資料後用指定的方式URL decoder

post

1.用戶端（瀏覽器）編碼

在post方法裡所要傳送的資料也要URL encode，那麼他是用什麼編碼方式的呢？

在form所在的html檔案裡如果有段<meta http-equiv="Content-Type" content="text/html; charset=字元集（GBK，utf-8等）"/>，那麼post就會用此處指定的編碼方式編碼。一般大家都認為這段代碼是為了讓瀏覽器知道用什麼字元集來對網頁解釋，所以網站都會把它放在html代碼的最前端，盡量不出現亂碼，其實它還有個作用就是指定form表單的post方法提交資料的 URL encode編碼方式。從這裡可以看出對於get方法來說，URL encode的編碼方式是由瀏覽器設定來決定，（可以用js做統一指定），而post方法，開發人員可以指定。

2.伺服器端解碼

如果用tomcat預設預設設定，也沒做過濾器等編碼設定，那麼他也是用iso-8859-1解碼的，但是request.setCharacterEncoding("字元集")可以派上用場。我發現上面說的tomcat所做的事情前提都是在要求標頭裡沒有指定編碼方式，如果要求標頭裡指定了編碼方式將按照指定的方式編碼。

在form所在的html檔案裡如果有段<meta http-equiv="Content-Type" content="text/html; charset=字元集（GBK，utf-8等）"/>

強烈建議使用post提交。

get跟post編碼--轉

本文章原先以中文撰寫並發佈於 aliyun.com，亦設英文版本，僅作資訊用途。本網站不對文章的準確性，完整性或可靠性或其任何翻譯作出任何明示或暗示的陳述或保證。如對該文章有任何疑慮或投訴，請傳送電郵至 info-contact@alibabacloud.com 並提供相關疑慮或投訴的詳細說明。職員會於 5 個工作天內與您聯絡，一經驗證之後，即會刪除該侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

Get Started for Free

Sales Support

1 on 1 presale consultation

Chat Contact Sales
After-Sales Support

24/7 Technical Support 6 Free Tickets per Quarter Faster Response

Open a Ticket
Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.

Learn More

get跟post編碼--轉

聯繫我們

A Free Trial That Lets You Build Big!

Sales Support

After-Sales Support