linux伺服器的Gzip檔案壓縮方法[轉]

來源:互聯網
上載者:User

標籤:style   blog   http   color   os   java   使用   io   strong   

一、gzip介紹

         gzip是GNU zip的縮寫,它是一個GNU自由軟體的檔案壓縮程式,也經常用來表示gzip這種檔案格式。軟體的作者是Jean-loup Gailly和Mark Adler。1992年10月31日第一次公開發布,版本號碼是0.1,目前的穩定版本是1.2.4。

        Gzip主要用於Unix系統的檔案壓縮。我們在Linux中經常會用到尾碼為.gz的檔案,它們就是GZIP格式的。現今已經成為Internet 上使用非常普遍的一種資料壓縮格式,或者說一種檔案格式。 當應用Gzip壓縮到一個純文字檔案時,效果是非常明顯的,經過GZIP壓縮後頁面大小可以變為原來的40%甚至更小,這取決於檔案中的內容。

  HTTP協議上的GZIP編碼是一種用來改進WEB應用程式效能的技術。web開發中可以通過gzip壓縮頁面來降低網站的流量,而gzip並不會對cpu造成大量的佔用,略微上升,也是幾個百分點而已,但是對於頁面卻能壓縮30%以上,非常划算。

      利用Apache中的Gzip模組,我們可以使用Gzip壓縮演算法來對Apache伺服器發布的網頁內容進行壓縮後再傳輸到用戶端瀏覽器。這樣經過壓縮後實際上降低了網路傳輸的位元組數(節約傳輸的網路I/o),最明顯的好處就是可以加快網頁載入的速度。

      網頁載入速度加快的好處不言而喻,除了節省流量,改善使用者的瀏覽體驗外,另一個潛在的好處是Gzip與搜尋引擎的抓取工具有著更好的關係。例如 Google就可以通過直接讀取gzip檔案來比普通手工抓取更快地檢索網頁。在Google網站管理員工具(Google Webmaster Tools)中你可以看到,sitemap.xml.gz 是直接作為Sitemap被提交的。

      而這些好處並不僅僅限於靜態內容,PHP動態網頁面和其他動態產生的內容均可以通過使用Apache壓縮模組壓縮,加上其他的效能調整機制和相應的伺服器端 緩衝規則,這可以大大提高網站的效能。因此,對於部署在Linux伺服器上的PHP程式,在伺服器支援的情況下,我們建議你開啟使用Gzip Web壓縮。

二、Web伺服器處理HTTP壓縮的過程如下:

    1. Web伺服器接收到瀏覽器的HTTP請求後,檢查瀏覽器是否支援HTTP壓縮(Accept-Encoding 資訊);

    2. 如果瀏覽器支援HTTP壓縮,Web伺服器檢查請求檔案的尾碼名;

    3. 如果請求檔案是HTML、CSS等靜態檔案,Web伺服器到壓縮緩衝目錄中檢查是否已經存在請求檔案的最新壓縮檔;

    4. 如果請求檔案的壓縮檔不存在,Web伺服器向瀏覽器返回未壓縮的請求檔案,並在壓縮緩衝目錄中存放請求檔案的壓縮檔;

    5. 如果請求檔案的最新壓縮檔已經存在,則直接返回請求檔案的壓縮檔;

    6. 如果請求檔案是動態檔案,Web伺服器動態壓縮內容並返回瀏覽器,壓縮內容不存放到壓縮緩衝目錄中。

下面是兩個示範圖:

                                       未使用Gzip:


                                     

                                  開啟使用Gzip後:

                                


三、啟用apache的gzip功能

      Apache上利用Gzip壓縮演算法進行壓縮的模組有兩種:mod_gzip 和mod_deflate。要使用Gzip Web壓縮,請首先確定你的伺服器開啟了對這兩個組件之一的支援。

      雖然使用Gzip同時也需要用戶端瀏覽器的支援,不過不用擔心,目前大部分瀏覽器都已經支援Gzip了,如IE、Mozilla Firefox、Opera、Chrome等。

     通過查看HTTP頭,我們可以快速判斷使用的用戶端瀏覽器是否支援接受gzip壓縮。若發送的HTTP頭中出現以下資訊,則表明你的瀏覽器支援接受相應的gzip壓縮:

  1. Accept-Encoding: gzip 支援mod_gzip  
  2. Accept-Encoding: deflate 支援mod_deflate   
  3.   
  4. Accept-Encoding: gzip,deflate 同時支援mod_gzip 和mod_deflate  

如firebug查看:

Accept-Encoding: gzip,deflate 是同時支援mod_gzip 和mod_deflate


   如果伺服器開啟了對Gzip組件的支援,那麼我們就可以在http.conf或.htaccess裡面進行定製,下面是一個.htaccess配置的簡單一實例:

mod_gzip 的配置:

  1. # mod_gzip:  
  2. <ifModule mod_gzip.c>  
  3. mod_gzip_on Yes  
  4. mod_gzip_dechunk Yes  
  5. mod_gzip_item_include file \.(html?|txt|css|js|php|pl)$  
  6. mod_gzip_item_include handler ^cgi-script$  
  7. mod_gzip_item_include mime ^text/.*  
  8. mod_gzip_item_include mime ^application/x-javascript.*  
  9. mod_gzip_item_exclude rspheader ^Content-Encoding:.*gzip.*  
  10. <ifModule>  

mod_deflate的配置執行個體:

開啟開啟apache 設定檔httpd.conf 

將#LoadModule deflate_module modules/mod_deflate.so去除開頭的#號

  1. # mod_deflate:  
  2. <ifmodule mod_deflate.c>  
  3. DeflateCompressionLevel 6 #壓縮率, 6是建議值.  
  4. AddOutputFilterByType DEFLATE text/plain  
  5. AddOutputFilterByType DEFLATE text/html  
  6. AddOutputFilterByType DEFLATE text/xml  
  7. AddOutputFilterByType DEFLATE text/css  
  8. AddOutputFilterByType DEFLATE text/javascript  
  9. AddOutputFilterByType DEFLATE application/xhtml+xml  
  10. AddOutputFilterByType DEFLATE application/xml  
  11. AddOutputFilterByType DEFLATE application/rss+xml  
  12. AddOutputFilterByType DEFLATE application/atom_xml  
  13. AddOutputFilterByType DEFLATE application/x-javascript  
  14. AddOutputFilterByType DEFLATE application/x-httpd-php  
  15. AddOutputFilterByType DEFLATE image/svg+xml  
  16. </ifmodule>  

裡面的檔案MIME類型可以根據自己情況添加,至於PDF 、圖片、音樂文檔之類的這些本身都已經高度壓縮格式,重複壓縮的作用不大,反而可能會因為增加CPU的處理時間及瀏覽器的渲染問題而降低效能。所以就沒必要再通過Gzip壓縮。通過以上設定後再查看返回的HTTP頭,出現以下資訊則表明返回的資料已經過壓縮。即網站程式所配置的Gzip壓縮已生效。

  1. Content-Encoding: gzip  

firebug查看:


注意:

1)不管使用mod_gzip 還是mod_deflate,此處返回的資訊都一樣。因為它們都是實現的gzip壓縮方式。

2)CompressionLevel 9是指壓縮程度的等級(設定壓縮比率),取值範圍在從1到9,9是最高等級。據瞭解,這樣做最高可以減少8成大小的傳輸量(看檔案內容而定),最少也能夠節省一半。 CompressionLevel 預設可以採用 6 這個數值,以維持耗用處理器效能與網頁壓縮品質的平衡. 不建議設定太高,如果設定很高,雖然有很高的壓縮率,但是佔用更多的CPU資源.
3) 對已經是壓縮過的圖片格式如jpg,音樂檔案如mp3、壓縮檔如zip之類的,就沒必要再壓縮了。

 

四、mod_gzip 和mod_deflate的主要區別是什嗎?使用哪個更好呢?

       第一個區別是安裝它們的Apache Web伺服器版本的差異:

       Apache 1.x系列沒有內建網頁壓縮技術,所以才去用額外的第三方mod_gzip 模組來執行壓縮。而Apache 2.x官方在開發的時候,就把網頁壓縮考慮進去,內建了mod_deflate 這個模組,用以取代mod_gzip。雖然兩者都是使用的Gzip壓縮演算法,它們的運作原理是類似的。

       第二個區別是壓縮品質:

       mod_deflate 壓縮速度略快而mod_gzip 的壓縮比略高。一般預設情況下,mod_gzip 會比mod_deflate 多出4%~6%的壓縮量。

       那麼,為什麼使用mod_deflate?

       第三個區別是對伺服器資源的佔用:

       一般來說mod_gzip 對伺服器CPU的佔用要高一些。mod_deflate 是專門為確保伺服器的效能而使用的一個壓縮模組,mod_deflate 需要較少的資源來壓縮檔。這意味著在高流量的伺服器,使用mod_deflate 可能會比mod_gzip 載入速度更快。

      不太明白?簡而言之,如果你的網站,每天不到1000獨立訪客,想要加快網頁的載入速度,就使用mod_gzip。雖然會額外耗費一些伺服器資源, 但也是值得的。如果你的網站每天超過1000獨立訪客,並且使用的是共用的虛擬機器主機,所分配系統資源有限的話,使用mod_deflate 將會是更好的選擇。

     另外,從Apache 2.0.45開始,mod_deflate 可使用DeflateCompressionLevel 指令來設定壓縮層級。該指令的值可為1(壓縮速度最快,最低的壓縮品質)至9(最慢的壓縮速度,壓縮率最高)之間的整數,其預設值為6(壓縮速度和壓縮質 量較為平衡的值)。這個簡單的變化更是使得mod_deflate 可以輕鬆媲美mod_gzip 的壓縮。

P.S. 對於沒有啟用以上兩種Gzip模組的虛擬空間,還可以退而求其次使用php的zlib函數庫(同樣需要查看伺服器是否支援)來壓縮檔,只是這種方法使用起來比較麻煩,而且一般會比較耗費伺服器資源,請根據情況謹慎使用。


五、zlib.output_compression和ob_gzhandler編碼方式壓縮

      伺服器不支援mod_gzip、mod_deflate模組,若想通過GZIP壓縮網頁內容,可以考慮兩種方式,開啟zlib.output_compression或者通過ob_gzhandler編碼的方式

      1)zlib.output_compression是在對網頁內容壓縮的同時發送資料至用戶端。

       2)ob_gzhandler是等待網頁內容壓縮完畢後才進行發送,相比之下前者效率更高,但需要注意的是,兩者不能同時使用,只能選其一,否則將出現錯誤。

       兩者的實現方式做簡單描述:

    1. zlib.output_compression實現方式

       在預設情況下,zlib.output_compression是關閉:

  1. ; Transparent output compression using the zlib library  
  2. ; Valid values for this option are ‘off‘, ‘on‘, or a specific buffer size  
  3. ; to be used for compression (default is 4KB)  
  4. ; Note: Resulting chunk size may vary due to nature of compression. PHP  
  5. ;   outputs chunks that are few hundreds bytes each as a result of  
  6. ;   compression. If you prefer a larger chunk size for better  
  7. ;   performance, enable output_buffering in addition.  
  8. ; Note: You need to use zlib.output_handler instead of the standard  
  9. ;   output_handler, or otherwise the output will be corrupted.  
  10. ; http://php.net/zlib.output-compression  
  11. zlib.output_compression = Off  
  12.   
  13. ; http://php.net/zlib.output-compression-level  
  14. ;zlib.output_compression_level = -1  

        如需開啟需編輯php.ini檔案,加入以下內容:

  1. zlib.output_compression = On  
  2. zlib.output_compression_level = 6  

       可以通過phpinfo()函數檢測結果。

        當zlib.output_compression的Local Value和MasterValue的值同為On時,表示已經生效,這時候訪問的PHP頁面(包括偽靜態頁面)已經GZIP壓縮了,通過Firebug或者線上網頁GZIP壓縮偵查工具可檢測到壓縮的效果。

      2. ob_gzhandler的實現方式

      如果需要使用ob_gzhandler,則需關閉zlib.output_compression,把php.ini檔案內容更改為:

  1. zlib.output_compression = Off  
  2. zlib.output_compression_level = -1  


通過在PHP檔案中插入相關代碼實現GZIP壓縮P壓縮:

  1. if (extension_loaded(‘zlib‘)) {  
  2.     if (  !headers_sent() AND isset($_SERVER[‘HTTP_ACCEPT_ENCODING‘]) &&  
  3.           strpos($_SERVER[‘HTTP_ACCEPT_ENCODING‘], ‘gzip‘) !== FALSE)  
  4.     //頁面沒有輸出且瀏覽器可以接受GZIP的頁面  
  5.     {  
  6.         ob_start(‘ob_gzhandler‘);  
  7.     }  
  8. }  
  9. //待壓縮的內容  
  10. echo $context;  
  11. ob_end_flush();  

       不管是zlib.output_compression還是ob_gzhandler,都僅能對PHP檔案進行GZIP壓縮,對於HTML、CSS、JS等靜態檔案只能通過調用PHP的方式實現。

最後想說的是,現在主流的瀏覽器預設使用的是HTTP1.1協議,基本都支援GZIP壓縮,對於IE而言,假如你沒有選中其功能表列工具-》Internet 選項-》進階-》HTTP 1.1 設定-》使用 HTTP 1.1,那麼,你將感受不到網頁壓縮後的速度提升所帶來的快感!

 

http://blog.csdn.net/hguisu/article/details/7793038

linux伺服器的Gzip檔案壓縮方法[轉]

相關文章

聯繫我們

該頁面正文內容均來源於網絡整理,並不代表阿里雲官方的觀點,該頁面所提到的產品和服務也與阿里云無關,如果該頁面內容對您造成了困擾,歡迎寫郵件給我們,收到郵件我們將在5個工作日內處理。

如果您發現本社區中有涉嫌抄襲的內容,歡迎發送郵件至: info-contact@alibabacloud.com 進行舉報並提供相關證據,工作人員會在 5 個工作天內聯絡您,一經查實,本站將立刻刪除涉嫌侵權內容。

A Free Trial That Lets You Build Big!

Start building with 50+ products and up to 12 months usage for Elastic Compute Service

  • Sales Support

    1 on 1 presale consultation

  • After-Sales Support

    24/7 Technical Support 6 Free Tickets per Quarter Faster Response

  • Alibaba Cloud offers highly flexible support services tailored to meet your exact needs.