HTTP 協議詳解

來源:互聯網
上載者:User

標籤:stat   參考   存在   transport   格式   錯誤   標記語言   類別   ams   

什麼是HTTP協議

  協議是指電腦通訊網路中兩台電腦之間進行通訊所必須共同遵守的規定或規則,超文字傳輸通訊協定 (HTTP)(HTTP)是一種通訊協定,它允許將超文字標記語言 (HTML)(HTML)文檔從Web伺服器傳送到用戶端的瀏覽器

  目前我們使用的是HTTP/1.1 版本

  Web伺服器,瀏覽器,Proxy 伺服器

  當我們開啟瀏覽器,在地址欄中輸入URL,然後我們就看到了網頁。 原理是怎樣的呢?

  實際上我們輸入URL後,我們的瀏覽器給Web伺服器發送了一個Request, Web伺服器接到Request後進行處理,產生相應的Response,然後發送給瀏覽器, 瀏覽器解析Response中的HTML,這樣我們就看到了網頁,過程如所示

  我們的Request 有可能是經過了Proxy 伺服器,最後才到達Web伺服器的。

  過程如所示

  Proxy 伺服器就是網路資訊的中轉站,有什麼功能呢?

  1. 提高訪問速度, 大多數的Proxy 伺服器都有緩衝功能。

  2. 突破限制, 也就是FQ了

  3. 隱藏身份。

  URL詳解

  URL(Uniform Resource Locator) 地址用於描述一個網路上的資源,  基本格式如下

schema://host[:port#]/path/.../[;url-params][?query-string][#anchor]

  scheme               指定低層使用的協議(例如:http, https, ftp)

  host                   HTTP伺服器的IP地址或者網域名稱

  port#                 HTTP伺服器的預設連接埠是80,這種情況下連接埠號碼可以省略。如果使用了別的連接埠,必須指明,例如 http://www.cnblogs.com:8080/

  path                   訪問資源的路徑

  url-params

  query-string       發送給http伺服器的資料

  anchor-             錨

  URL 的一個例子

http://www.mywebsite.com/sj/test;id=8079?name=sviergn&x=true#stuff

Schema: http

host: www.mywebsite.com

path: /sj/test

URL params: id=8079

Query String: name=sviergn&x=true

Anchor: stuff

  HTTP協議是無狀態的

  http協議是無狀態的,同一個用戶端的這次請求和上次請求是沒有對應關係,對http伺服器來說,它並不知道這兩個請求來自同一個用戶端。 為瞭解決這個問題, Web程式引入了Cookie機制來維護狀態.

  HTTP訊息的結構

  先看Request 訊息的結構,   Request 訊息分為3部分,第一部分叫請求行, 第二部分叫http header, 第三部分是body. header和body之間有個空行, 結構如

  第一行中的Method表示要求方法,比如"POST","GET",  Path-to-resoure表示請求的資源, Http/version-number 表示HTTP協議的版本號碼

  當使用的是"GET" 方法的時候, body是為空白的

  比如我們開啟部落格園首頁的request 如下

GET http://www.cnblogs.com/ HTTP/1.1

Host: www.cnblogs.com

  我們用Fiddler 捕捉一個部落格園登入的Request 然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Request的訊息,   如

  我們再看Response訊息的結構, 和Request訊息的結構基本一樣。 同樣也分為三部分,第一部分叫request line, 第二部分叫request header,第三部分是body. header和body之間也有個空行,  結構如

  HTTP/version-number表示HTTP協議的版本號碼,  status-code 和message 請看下節[狀態碼]的詳細解釋.

  我們用Fiddler 捕捉一個部落格園首頁的Response然後分析下它的結構, 在Inspectors tab下以Raw的方式可以看到完整的Response的訊息,   如

  Get和Post方法的區別

  Http協議定義了很多與伺服器互動的方法,最基本的有4種,分別是GET,POST,PUT,DELETE. 一個URL地址用於描述一個網路上的資源,而HTTP中的GET, POST, PUT, DELETE就對應著對這個資源的查,改,增,刪4個操作。 我們最常見的就是GET和POST了。GET一般用於擷取/查詢資源資訊,而POST一般用於更新資源資訊.

  我們看看GET和POST的區別

  1. GET提交的資料會放在URL之後,以?分割URL和傳輸資料,參數之間以&相連,如EditPosts.aspx?name=test1&id=123456.  POST方法是把提交的資料放在HTTP包的Body中.

  2. GET提交的資料大小有限制(因為瀏覽器對URL的長度有限制),而POST方法提交的資料沒有限制.

  3. GET方式需要使用Request.QueryString來取得變數的值,而POST方式通過Request.Form來擷取變數的值。

  4. GET方式提交資料,會帶來安全問題,比如一個登入頁面,通過GET方式提交資料時,使用者名稱和密碼將出現在URL上,如果頁面可以被緩衝或者其他人可以訪問這台機器,就可以從記錄獲得該使用者的帳號和密碼.

  狀態代碼

  Response 訊息中的第一行叫做狀態行,由HTTP協議版本號碼, 狀態代碼, 狀態訊息 三部分組成。

  狀態代碼用來告訴HTTP用戶端,HTTP伺服器是否產生了預期的Response.

  HTTP/1.1中定義了5類狀態代碼, 狀態代碼由三位元字組成,第一個數字定義了響應的類別

  1XX  提示資訊 - 表示請求已被成功接收,繼續處理

  2XX  成功 - 表示請求已被成功接收,理解,接受

  3XX  重新導向 - 要完成請求必須進行更進一步的處理

  4XX  用戶端錯誤 -  請求有語法錯誤或請求無法實現

  5XX  伺服器端錯誤 -   伺服器未能實現合法的請求

  看看一些常見的狀態代碼

  200 OK

  最常見的就是成功響應狀態代碼200了, 這表明該請求被成功地完成,所請求的資源發送回用戶端

  如, 開啟部落格園首頁

  302 Found

  重新導向,新的URL會在response中的Location中返回,瀏覽器將會使用新的URL發出新的Request。

  例如在IE中輸入http://www.google.com. HTTP伺服器會返回304, IE取到Response中Location header的新URL, 又重新發送了一個Request.

  304 Not Modified

  代表上次的文檔已經被緩衝了, 還可以繼續使用,

  例如開啟部落格園首頁, 發現很多 Response 的status code 都是304

  提示: 如果你不想使用本機快取可以用Ctrl+F5強制重新整理頁面

  400 Bad Request  用戶端請求與語法錯誤,不能被伺服器所理解

  403 Forbidden 伺服器收到請求,但是拒絕提供服務

  404 Not Found

  請求資源不存在(輸錯了URL)

  比如在IE中輸入一個錯誤的URL, http://www.cnblogs.com/tesdf.aspx

  500 Internal Server Error 伺服器發生了不可預期的錯誤

  503 Server Unavailable 伺服器當前不能處理用戶端的請求,一段時間後可能恢複正常

  HTTP Request header

  使用Fiddler 能很方便的查看Reques header, 點擊Inspectors tab -> Request tab -> headers  如所示.

  header 有很多,比較難以記憶,我們也按照Fiddler那樣把header 進行分類,這樣比較清晰也容易記憶。

  Cache 頭域

  If-Modified-Since

  作用: 把瀏覽器端快取頁面面的最後修改時間發送到伺服器去,伺服器會把這個時間與伺服器上實際檔案的最後修改時間進行對比。如果時間一致,那麼返回304,用戶端就直接使用本機快取檔案。如果時間不一致,就會返回200和新的檔案內容。用戶端接到之後,會丟棄舊檔案,把新檔案快取起來,並顯示在瀏覽器中。

  例如:If-Modified-Since: Thu, 09 Feb 2012 09:07:57 GMT

  執行個體如

  If-None-Match

  作用: If-None-Match和ETag一起工作,工作原理是在HTTP Response中添加ETag資訊。 當使用者再次請求該資源時,將在HTTP Request 中加入If-None-Match資訊(ETag的值)。如果伺服器驗證資源的ETag沒有改變(該資源沒有更新),將返回一個304狀態告訴用戶端使用本機快取檔案。否則將返回200狀態和新的資源和Etag.  使用這樣的機制將提高網站的效能

  例如: If-None-Match: "03f2b33c0bfcc1:0"

  執行個體如

  Pragma

  作用: 防止頁面被緩衝, 在HTTP/1.1版本中,它和Cache-Control:no-cache作用一模一樣

  Pargma只有一個用法, 例如: Pragma: no-cache

  注意: 在HTTP/1.0版本中,只實現了Pragema:no-cache, 沒有實現Cache-Control

  Cache-Control

  作用: 這個是非常重要的規則。 這個用來指定Response-Request遵循的緩衝機制。各個指令含義如下

  Cache-Control:Public   可以被任何緩衝所緩衝()

  Cache-Control:Private     內容只緩衝到私人緩衝中

  Cache-Control:no-cache  所有內容都不會被緩衝

  還有其他的一些用法, 我沒搞懂其中的意思, 請大家參考其他的資料

  Client 頭域

  Accept

  作用: 瀏覽器端可以接受的媒體類型,

  例如:  Accept: text/html  代表瀏覽器可以接受伺服器回傳的類型為 text/html  也就是我們常說的html文檔,

  如果伺服器無法返回text/html類型的資料,伺服器應該返回一個406錯誤(non acceptable)

  萬用字元 * 代表任意類型

  例如  Accept: */*  代表瀏覽器可以處理所有類型,(一般瀏覽器發給伺服器都是發這個)

  Accept-Encoding:

  作用: 瀏覽器申明自己接收的編碼方法,通常指定壓縮方法,是否支援壓縮,支援什麼壓縮方法(gzip,deflate),(注意:這不是隻字符編碼);

  例如: Accept-Encoding: gzip, deflate

  Accept-Language

  作用: 瀏覽器申明自己接收的語言。 

  語言跟字元集的區別:中文是語言,中文有多種字元集,比如big5,gb2312,gbk等等;

  例如: Accept-Language: en-us

  User-Agent

  作用:告訴HTTP伺服器, 用戶端使用的作業系統和瀏覽器的名稱和版本.

  我們上網登陸論壇的時候,往往會看到一些歡迎資訊,其中列出了你的作業系統的名稱和版本,你所使用的瀏覽器的名稱和版本,這往往讓很多人感到很神奇,實際上,伺服器應用程式就是從User-Agent這個請求前序域中擷取到這些資訊User-Agent請求前序域允許用戶端將它的作業系統、瀏覽器和其它屬性告訴伺服器。

  例如: User-Agent: Mozilla/4.0 (compatible; MSIE 8.0; Windows NT 5.1; Trident/4.0; CIBA; .NET CLR 2.0.50727; .NET CLR 3.0.4506.2152; .NET CLR 3.5.30729; .NET4.0C; InfoPath.2; .NET4.0E)

  Accept-Charset

  作用:瀏覽器申明自己接收的字元集,這就是本文前面介紹的各種字元集和字元編碼,如gb2312,utf-8(通常我們說Charset包括了相應的字元編碼方案);

  例如:

  Cookie/Login 頭域

  Cookie:

  作用: 最重要的header, 將cookie的值發送給HTTP 伺服器

  Entity頭域

  Content-Length

  作用:發送給HTTP伺服器資料的長度。

  例如: Content-Length: 38

  Content-Type

  作用:

  例如:Content-Type: application/x-www-form-urlencoded

  Miscellaneous 頭域

  Referer:

  作用: 提供了Request的上下文資訊的伺服器,告訴伺服器我是從哪個連結過來的,比如從我首頁上連結到一個朋友那裡,他的伺服器就能夠從HTTP Referer中統計出每天有多少使用者點擊我首頁上的連結訪問他的網站。

  例如: Referer:http://translate.google.cn/?hl=zh-cn&tab=wT

  Transport 頭域

  Connection

  例如: Connection: keep-alive   當一個網頁開啟完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連不會關閉,如果用戶端再次訪問這個伺服器上的網頁,會繼續使用這一條已經建立的串連

  例如:  Connection: close  代表一個Request完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連會關閉, 當用戶端再次發送Request,需要重建立立TCP串連。

  Host(發送請求時,該前序域是必需的)

  作用: 請求前序域主要用於指定被請求資源的Internet主機和連接埠號碼,它通常從HTTP URL中提取出來的

  例如: 我們在瀏覽器中輸入:http://www.guet.edu.cn/index.html

  瀏覽器發送的請求訊息中,就會包含Host請求前序域,如下:

  Host:http://www.guet.edu.cn

  此處使用預設連接埠號碼80,若指定了連接埠號碼,則變成:Host:指定連接埠號碼

HTTP Response header

  同樣使用Fiddler 查看Response header, 點擊Inspectors tab ->Response tab-> headers  如所示

  我們也按照Fiddler那樣把header 進行分類,這樣比較清晰也容易記憶。

  Cache頭域

  Date

  作用:  產生訊息的具體時間和日期

  例如: Date: Sat, 11 Feb 2012 11:35:14 GMT 

  Expires

  作用: 瀏覽器會在指定到期時間內使用本機快取

  例如: Expires: Tue, 08 Feb 2022 11:35:14 GMT

  Vary

  作用:

  例如: Vary: Accept-Encoding

  Cookie/Login 頭域

  P3P

  作用: 用於跨網域設定Cookie, 這樣可以解決iframe跨域訪問cookie的問題

  例如: P3P: CP=CURa ADMa DEVa PSAo PSDo OUR BUS UNI PUR INT DEM STA PRE COM NAV OTC NOI DSP COR

  Set-Cookie

  作用: 非常重要的header, 用於把cookie 發送到用戶端瀏覽器, 每一個寫入cookie都會產生一個Set-Cookie.

  例如: Set-Cookie: sc=4c31523a; path=/; domain=.acookie.taobao.com

  Entity頭域

  ETag

  作用:  和If-None-Match 配合使用。 (執行個體請看上節中If-None-Match的執行個體)

  例如: ETag: "03f2b33c0bfcc1:0"

  Last-Modified:

  作用: 用於指示資源的最後修改日期和時間。(執行個體請看上節的If-Modified-Since的執行個體)

  例如: Last-Modified: Wed, 21 Dec 2011 09:09:10 GMT

  Content-Type

  作用:WEB伺服器告訴瀏覽器自己響應的對象的類型和字元集,

  例如:

  Content-Type: text/html; charset=utf-8

  Content-Type:text/html;charset=GB2312

  Content-Type: image/jpeg

  Content-Length

  指明實體本文的長度,以位元組方式儲存的十進位數字來表示。在資料下行的過程中,Content-Length的方式要預先在伺服器中緩衝所有資料,然後所有資料再一股腦兒地發給用戶端。

  例如: Content-Length: 19847

  Content-Encoding

  WEB伺服器表明自己使用了什麼壓縮方法(gzip,deflate)壓縮響應中的對象。

  例如:Content-Encoding:gzip

  Content-Language

  作用: WEB伺服器告訴瀏覽器自己響應的對象的語言者

  例如: Content-Language:da

  Miscellaneous 頭域

  Server:

  作用:指明HTTP伺服器的軟體資訊

  例如:Server: Microsoft-IIS/7.5

  X-AspNet-Version:

  作用:如果網站是用ASP.NET開發的,這個header用來表示ASP.NET的版本

  例如: X-AspNet-Version: 4.0.30319

  X-Powered-By:

  作用:表示網站是用什麼技術開發的

  例如: X-Powered-By: ASP.NET

  Transport頭域

  Connection

  例如: Connection: keep-alive   當一個網頁開啟完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連不會關閉,如果用戶端再次訪問這個伺服器上的網頁,會繼續使用這一條已經建立的串連

  例如:  Connection: close  代表一個Request完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連會關閉, 當用戶端再次發送Request,需要重建立立TCP串連。

  Location頭域

  Location

  作用: 用於重新導向一個新的位置, 包含新的URL地址

  執行個體請看304狀態執行個體

  HTTP協議是無狀態的和Connection: keep-alive的區別

  無狀態是指協議對於交易處理沒有記憶能力,伺服器不知道用戶端是什麼狀態。從另一方面講,開啟一個伺服器上的網頁和你之前開啟這個伺服器上的網頁之間沒有任何聯絡。

  HTTP是一個無狀態的連線導向的協議,無狀態不代表HTTP不能保持TCP串連,更不能代表HTTP使用的是UDP協議(無串連)。

  從HTTP/1.1起,預設都開啟了Keep-Alive,保持串連特性,簡單地說,當一個網頁開啟完成後,用戶端和伺服器之間用於傳輸HTTP資料的TCP串連不會關閉,如果用戶端再次訪問這個伺服器上的網頁,會繼續使用這一條已經建立的串連。

  Keep-Alive不會永久保持串連,它有一個保持時間,可以在不同的伺服器軟體(如Apache)中設定這個時間。

HTTP 協議詳解

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.