mod_gzip是一個Apache模組,其功能是使用Gzip壓縮靜態html頁面,遵循IETF標準的瀏覽器可以接受gzip編碼(IE, Netscape等)。mod_gzip可以將頁面的下載時間提高4-5倍。我強烈建議你在你的web伺服器上使用mod_gzip。然而,我們還必須用PHP建立我們自己的壓縮引擎。在這篇文章裡,我將要介紹如何使用PHP的輸出控制函數來大幅加速頁面載入速度。
介紹PHP的輸出控制函數
PHP4中最令人滿意的事是——你可以讓PHP緩衝所有由指令碼產生的輸出,在你決定把它們送出之前,瀏覽器方是不會收到任何內容的。在指令碼程式中你能用這些函數來設定header、cookies,然而這隻是強大的輸出函數的一小部分功能。
複製代碼 代碼如下:
<?php
void ob_start(void);
?>
告訴PHP處理器把所有的輸出重新導向到一個內部的緩衝(buffer)中。在調用ob_start之前,沒有輸出會被送到瀏覽器去。
複製代碼 代碼如下:
<?php
string ob_get_contents(void);
?>
該函數將“輸出緩衝”(output buffer)以字串的形式返回。你可以調用該函數把積累下來的輸出送到瀏覽器中。(僅在把buffering功能關閉之後!!)
複製代碼 代碼如下:
<?php
int ob_get_length(void);
?>
返回緩衝中的字串的長度。
複製代碼 代碼如下:
<?php
void ob_end_clean(void);
?>
清空輸出緩衝,並將輸出緩衝關閉。在緩衝中的內容輸出到瀏覽器之前,必須使用這個函數。
void 501([int flag])
用來開啟/關閉隱含的flush動作開關(預設是關)。如果flush是開的,每次調用print/echo或是其它輸出命令的時候,輸出的內容會被立即送到瀏覽器端。
使用輸出控制來壓縮PHP輸出
你必須使用PHP4裡編譯的Zlib擴充包來壓縮輸出。如果需要的話,可以查看PHP文檔中有關Zlib包的安裝指導。
首先,初始化輸出緩衝:
複製代碼 代碼如下:
<?php
ob_start();
ob_implicit_flush(0);
?>
之後,用print, echo, 或其他你喜歡的方法產生所有輸出內容,例如:
複製代碼 代碼如下:
<?php
print("Hey this is a compressed output!");
?>
頁面產生後,我們取回輸出內容:
複製代碼 代碼如下:
<?php
$contents = ob_get_contents();
ob_end_clean();
?>
之後,必須檢測瀏覽器是否支援壓縮資料。如果支援,瀏覽器會發給伺服器端一個ACCEPT-ENCODEING HTTP頭。我們只需檢查$HTTP_ACCEPT_ENCODING變數中是否有“gzip,deflate”字串。
複製代碼 代碼如下:
<?php
if(ereg('gzip, deflate',$HTTP_ACCEPT_ENCODING)) {
// 在這裡產生 Gzip 壓縮的內容
} else {
echo $contents;
}
?>
這種方法使用起來既簡單又結構清晰。下面讓我們看看如何產生壓縮的輸出:
複製代碼 代碼如下:
<?php
//告訴瀏覽器將要收到的是gzip資料
//當然在此之前,你已經檢查了它們是否支援gzip,x-gzip資料格式
//如果支援的是x-gzip,那麼下面的頭就要用z-gzip來代替
header("Content-Encoding: gzip");
//顯示gzip檔案的頭
//只需顯示一次
echo "x1fx8bx08x00x00x00x00x00";
//計算出檔案的大小和CRC碼
$Size = strlen($contents);
$Crc = crc32($contents);
//壓縮資料
$contents = gzcompress($contents, 9);
//我們不能就這樣輸出,因為CRC碼是混亂的。
//如果我在這裡使用“echo $contents”,壓縮的資料會被送出,
//但是卻不完整。檔案最後的四個位元組是CRC校正碼,可是只發出去了三個位元組。
//最後一個位元組被丟掉了。我不知道這個bug在4.0.2版中解決了沒有,
//不過最好避免錯誤的方法是把正確的CRC校正碼加到壓縮的資料的末尾。
//
//把舊的CRC校正碼剝離
$contents = substr($contents, 0, strlen($contents) - 4);
//僅顯示壓縮的資料
echo $contents;
//輸出CRC,和原來資料的大小(位元組)
gzip_PrintFourChars($Crc);
gzip_PrintFourChars($Size);
function gzip_PrintFourChars($Val) {
for ($i = 0; $i <4; $i ++) {
echo chr($Val % 256);
$Val = floor($Val / 256);
}
}
?>
//好了,你還可以按此方式附加上更多的壓縮資料。
要想進行實際的測試,所有的指令碼代碼如下:
複製代碼 代碼如下:
<?php
ob_start();
ob_implicit_flush(0);
print("I'm compressed!n");
$contents = ob_get_contents();
ob_end_clean();
header("Content-Encoding: gzip");
echo "x1fx8bx08x00x00x00x00x00";
$Size = strlen($contents);
$Crc = crc32($contents);
$contents = gzcompress($contents, 9);
$contents = substr($contents, 0, strlen($contents) - 4);
echo $contents;
gzip_PrintFourChars($Crc);
gzip_PrintFourChars($Size);
function gzip_PrintFourChars($Val) {
for ($i = 0; $i <4; $i ++) {
echo chr($Val % 256);
$Val = floor($Val / 256);
}
}
?>
緩衝PHP輸出
當PHP4還沒問世,我不得不使用PHP3的時候,我對開發一些緩衝機制來減少資料庫的載入、對檔案系統的存取十分感興趣。在PHP3中沒有什麼特別好的方法,但是有了輸出緩衝之後,在PHP4中一切變得容易多了。
這有一個簡單的例子:
複製代碼 代碼如下:
<?php
//為請求的URI構造一個檔案名稱
$cached_file=md5($REQUEST_URI);
if((!file_exists("/cache/$cached_file"))||(!is_valid("/cache/$cached_file"))) {
//is_valid函數驗證緩衝,你可以用這個函數檢查Cache是否到期或其他特定的條件。
//如果檔案不在Cache中或者不可用則產生輸出
ob_start();
ob_implicit_flush(0);
//在此輸出……
$contents = ob_get_contents();
ob_end_clean();
$fil=fopen($cached_file,"w+");
fwrite($fil,$contents,$strlen($contents));
fclose($fil);
}
/如果請求的檔案在緩衝中且可用,則:
readfile($cached_file);
?>
這是一個簡單的例子,使用輸出緩衝,你可以建立一個複雜的內容產生系統,對不同的塊或程式使用不同的緩衝機制,等等……
結論
PHP輸出控制函數對把指令碼產生的輸出重新導向到緩衝中十分有用。為支援gzip的瀏覽器輸出壓過的快取資料可以減少載入時間。也可作為緩衝機制來減少對資料來源的存取(資料庫或檔案),這對使用XML意義重大。
如果我們用PHP建立一個引擎,緩衝從資料來源得到的資料(xml文檔和資料庫),並且動態產生XML格式的內容(沒有外觀-presentation)我們可以得到這些XML的輸出,並使用XSLT轉換成任意一種我們想要的外觀格式(html, wap, palm, pdf等)。使用PHP4的輸出緩衝和Sablotron XSLT擴充可以很好地完成這個任務。