標籤:預設 擷取 head 效率 style 情況 部分 decode 文檔
HTTP內容編碼和HTTP壓縮的區別
HTTP壓縮,在HTTP協議中,其實是內容編碼的一種。
在http協議中,可以對內容(也就是body部分)進行編碼, 可以採用gzip這樣的編碼。 從而達到壓縮的目的。 也可以使用其他的編碼把內容攪亂或加密,以此來防止未授權的第三方看到文檔的內容。
所以我們說HTTP壓縮,其實就是HTTP內容編碼的一種。 所以大家不要把HTTP壓縮和HTTP內容編碼兩個概念混淆了。
HTTP壓縮的過程
1. 瀏覽器發送Http request 給Web伺服器, request 中有Accept-Encoding: gzip, deflate。 (告訴伺服器, 瀏覽器支援gzip壓縮)
2. Web伺服器接到request後, 產生原始的Response, 其中有原始的Content-Type和Content-Length。
3. Web伺服器通過Gzip,來對Response進行編碼, 編碼後header中有Content-Type和Content-Length(壓縮後的大小), 並且增加了Content-Encoding:gzip. 然後把Response發送給瀏覽器。
4. 瀏覽器接到Response後,根據Content-Encoding:gzip來對Response 進行解碼。 擷取到原始response後, 然後顯示出網頁。
如:
執行個體:Fiddler觀察HTTP壓縮
眼見為實, 我們看一個實際的例子, 我發現部落格園就使用了gzip壓縮。
使用Fiddler可以清楚地看到。
在Fiddler中,每次都要手動去decode. 太麻煩。 點擊工具列上的"Decode"按鈕,就可以自動decode了。
內容編碼類別型
HTTP定義了一些標準的內容編碼類別型,並允許用擴充的形式添加更多的編碼。
Content-Encoding header 就用這些標準化的代號來說明編碼時使用的演算法
Content-Encoding值
gzip 表明實體採用GNU zip編碼
compress 表明實體採用Unix的檔案壓縮程式
deflate 表明實體是用zlib的格式壓縮的
identity 表明沒有對實體進行編碼。當沒有Content-Encoding header時, 就預設為這種情況
gzip, compress, 以及deflate編碼都是無損壓縮演算法,用於減少傳輸報文的大小,不會導致資訊損失。 其中gzip通常效率最高, 使用最為廣泛。
壓縮的好處
http壓縮對純文字可以壓縮至原內容的40%, 從而節省了60%的資料轉送。
執行個體: 部落格園首頁壓縮前是:46124 bytes. 壓縮後是:16368bytes. 只有原先的35%。 節省了65%的資料轉送,從而大大提高了效能
有圖為證。
Gzip的缺點
JPEG這類檔案用gzip壓縮的不夠好。
Gzip是如何壓縮的
簡單來說, Gzip壓縮是在一個文字檔中找出類似的字串, 並臨時替換他們,使整個檔案變小。這種形式的壓縮對Web來說非常適合, 因為HTML和CSS檔案通常包含大量的重複的字串,例如空格,標籤。
HTTP Response能壓縮,HTTP Request也是可以壓縮的
瀏覽器是不會對Request壓縮的。 但是 一些HTTP程式在發送Request時,會對其進行編碼。 如。
HTTP協議 (三) 壓縮